之前用kindle导出的txt文件是unicode编码的,想要自己写个小程序来自行格式化,然而怎么读都是乱码。像这样:
一开始没有找到办法只好把txt文件另存为ansi格式,顺利格式化了。
但是,为什么会读取成这样呢?
最后一直查办法终于找到了这个东西:chardet
导入它以后使用
这个方法
得到了
原来虽然是unicode编码,但还是不一样的.
再将text解码,终于得到了好看的编码
——————————
之前用kindle导出的txt文件是unicode编码的,想要自己写个小程序来自行格式化,然而怎么读都是乱码。像这样:
一开始没有找到办法只好把txt文件另存为ansi格式,顺利格式化了。
但是,为什么会读取成这样呢?
最后一直查办法终于找到了这个东西:chardet
导入它以后使用
这个方法
得到了
原来虽然是unicode编码,但还是不一样的.
再将text解码,终于得到了好看的编码
——————————