python读取unicode编码txt文件

之前用kindle导出的txt文件是unicode编码的,想要自己写个小程序来自行格式化,然而怎么读都是乱码。像这样:

一开始没有找到办法只好把txt文件另存为ansi格式,顺利格式化了。

但是,为什么会读取成这样呢?

最后一直查办法终于找到了这个东西:chardet

导入它以后使用

这个方法

得到了

原来虽然是unicode编码,但还是不一样的.

再将text解码,终于得到了好看的编码

——————————


猜你喜欢

转载自blog.csdn.net/csdn_yi_e/article/details/71037288