文本文件处理

有编码头的情况:编码头:(UTF16大端)0xFF0xFE ,((UTF16小端)0xFE0xFF,(UTF8)0xEF0xBB0xBF 
编码头不是强制加上可以没有。
对于没有编码的头的情况:先判断是不是UTF8,一个UTF8字符有三种情况:1字节(小于0x80),2字节(0xC0 到0xE0),3字节(0xE0到0xF0)
不是UTF8再判断是否UTF16。对于UTF16的大端和小端不好区分,先转换成UTF8在判断。
如果不是UTF8不是UTF16那么就一定是ASCII了

猜你喜欢

转载自huzhenyu.iteye.com/blog/1703700