python3的文件编码问题 - 代码天地

python3的文件编码问题

企业开发 2023-09-30 12:48:14 阅读次数: 0

最近手头要做一下文本过滤的相关，于是涉及到这个问题。因为用到wordmaker来生成字典，但是呢，wordmaker的input file目前只支持gbk编码。所以，做的时候就遇到了文件编码转换的问题。

最初的解决方法是直接指定文件的编码，open(file_name, 'w', encoding='gbk')，随手跑了下发现可以的。但是跑全量的时候挂掉了，然后回头看的时候，发现有些数据里面不仅包含中文，还有其他非中文的字符，然后就网上各种找，发现了这个：

编码名称	用途
utf8	所有语言
gbk	简体中文
gb2312	简体中文
gb18030	简体中文
big5	繁体中文
big5hkscs	繁体中文

然后就发现，gbk编码只是utf-8编码的一部分，那这样的话不在gbk编码表中的字符就不能转换，然后就想着用encode函数把非gbk编码的字符过滤掉然后再编码，于是解决。

dat = data.encode('gbk', errors='ignore').decode('gbk')

猜你喜欢

转载自blog.csdn.net/u014443884/article/details/79035426

python3的文件编码问题

python3编码问题

Python3的编码问题

PYTHON3 编码问题

python3写入文件由于编码问题报错

python3 读文件编码错误

python3 中的中文编码问题

python3 编码与解码问题

python3编码问题汇总

Python3 字符编码问题

python3爬虫编码问题

unicode 在python3中的编码问题

python3编码方式问题

Python3的编码问题（笔记）

python3编码问题 encode decode

python3中编码与解码的问题

python3 编码问题汇总

Python3 编码

Python3编码

Python3 解决读取中文文件txt编码的问题

Python2和Python3 编码问题

python2和python3编码问题

python2 与 python3 编码问题总结

python基础-python3编码问题汇总

python2 python3编码问题记录

python3 open文件错误-都是编码惹的祸

Python3批量转换文件编码

python3 中字符串编码问题

计算机编码问题python3

Python3的unicode编码转换成中文问题

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)