Python 学习笔记_转码问题的解决方法：“ignore” - 代码天地

Python 学习笔记_转码问题的解决方法：“ignore”

其他 2019-01-25 01:34:33 阅读次数: 0

若希望将 Json 文件转化为 python 形式的 Unicode 字符串，可以如下操作：

unicodestr = json.loads(html.decode("gbk"))

但在实际开发中，这种办法时常会出现异常：

UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 205: illegal multibyte sequence

经网上查询了解到这是因为遇到了非法字符——尤其是在某些用 C/C++ 编写的程序中，全角空格往往有多种不同的实现方式，比如 \xa3\xa0 ，或者 \xa4\x57 ，这些字符，看起来都是全角空格，但它们并不是“合法”的全角空格（真正的全角空格是 \xa1\xa1 ），因此在转码的过程中出现了异常。

这样的问题很让人头疼，因为只要字符串中出现了一个非法字符，整篇文章就都无法转码。

解决办法：

unicodestr = json.loads(html.decode("gbk","ignore"))

因为 decode 的函数原型是 decode([encoding], [errors=‘strict’])，可以用第二个参数控制错误处理的策略，默认的参数就是 strict，代表遇到非法字符时抛出异常；

如果设置为 ignore，则会忽略非法字符；
如果设置为 replace，则会用?取代非法字符；
如果设置为 xmlcharrefreplace，则使用XML的字符引用；
如果设置为 backslashreplace，则非法字符不转码展示。

via：https://blog.csdn.net/m0_37374307/article/details/80319146

猜你喜欢

转载自blog.csdn.net/weixin_41287692/article/details/86626288

Python 学习笔记_转码问题的解决方法：“ignore”

Python转码问题的解决方法——illegal multibyte sequence

学习笔记，学习python时碰到的小问题和解决方法

python 问题及解决方法

python学习之路遇到的问题以及解决方法

python注意问题及解决方法

Python（Django）遇到的问题及解决方法

Python3+Appium学习笔记05-报错及解决方法

Python学习笔记：pip升级失败解决方法(win10)

mac 安装 python mysqlclient 遇到的问题及解决方法

Python版本问题出现DeprecationWarning的解决方法

Python Socket通信黏包问题分析及解决方法

python 使用中遇到的问题，记录及解决方法

Python中遇到的小问题及解决方法汇总

python 使用Graphviz绘图时遇到的问题、解决方法

python爬虫中遇到的问题以及解决方法

Centos7——yum与python重装问题及解决方法

python之pip更新失败问题及解决方法

python读取文本时出现的问题和解决方法

Python中遇到的问题以及解决方法

python 进程内存增长问题, 解决方法和工具

对Python多线程死锁问题的巧妙解决方法

Pycharm(Python)下imshow函数显示问题的解决方法

Python中TypeError: ‘str‘ object is not callable 问题的解决方法

Python字符编码问题解析及解决方法

Python 报错解决方法

Python学习：numpy库数据量太大出现Memory Error问题的解决方法汇总

python unicode 转码问题详解

python学习：字符编码与转码

python 2 python3 同时安装遇到问题解决方法

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)