python/java 中使用split()分割字符串时第一个字符乱码问题

这个牵扯到文件编码问题,不同格式的文件最前边有一个BOM来说明这个文件的编码格式,这个BOM是看不见的。比如我们写一个unicode格式文件,然后将其保存成utf-8格式,此时在程序中读入该文件对其进行split()分割第一个字符就会出现\ufeff乱码!
解决方法:把我们读文件时指定的utf-8改成utf-8-sig即可。sig为signature的意思,这样就会去掉文件头中的BOM。

发布了14 篇原创文章 · 获赞 0 · 访问量 636

猜你喜欢

转载自blog.csdn.net/goodgoodstudyddp/article/details/104569109
今日推荐