2009年1月9日星期五

如何判断文本文件编码

根据不同编码的特点和标志,对一个文本文件判断编码方法如下
1 . UTF7 所有字节的内容不会大于127,也就是不大于&HFF
2 . UTF8 起始三个字节为"EF BB BF"
3 . UTF16BigEndian 起始三个字节为"FE FF"
4 . UTF16SmallEndian 起始三个字节为"FF FE"注: BigEndian 和SmallEndian 表示存储方式的高位在前或者低位 在前,高位在前叫BigEndian 反之叫SmallEndian

没有评论:

发表评论