Python第三方库requests的编码问题 - 代码天地

Python第三方库requests的编码问题

其他 2020-01-25 10:56:17 阅读次数: 0

PS：这个解决方法可能很简单，但是这是平时的一些细节问题，所以有必要提醒一下！

首先代码不多，就是通过get方法去获取豆瓣首页信息，如图：但是会报UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 42358: illegal multibyte sequence错误

其中，r.encoding是获取响应头Content-Type的charset值，有的网站没有charset字段，就可能使用默认的 ISO-8859-1，一般那些不规范的页面往往有这样的问题.，所以这种方法可能获取编码不准确。

那么r.apparent_encoding就是获取网站真实的编码，apparent_encoding通过调用chardet.detect()来识别文本编码。

情况一：这可能是大家正常情况下最常遇到的问题，那就是没有charset字段，或者编码与charset字段的不符合。

解决方法：

如果没有charset字段，可以通过r.apparent_encoding获取真实的编码，再使用r.encoding = ‘xxx’指定正确的编码，这样在调用text时就会根据指定的字符编码进行转换。
如果与charset的编码不符合，直接用r.encoding = ‘xxx’指定charset的编码就OK啦！

情况二：通过r.encoding或者r.apparent_encoding获取的编码都是一样的，但是还是会报编码错误，这种情况可能就要考虑下IDE的字符编码设置问题了。

以PyCharm为例按如下路径：file→settings→Editor→File Encodings→Project Encoding进行设置，如图：

推荐看一下我以前的文章：Pycharm有必要改的几个默认设置项

欢迎与我一起学习！

卿水若流火

发布了19 篇原创文章 · 获赞 171 · 访问量 13万+

私信关注

猜你喜欢

转载自blog.csdn.net/dbdd_cf/article/details/86240201

Python第三方库requests的编码问题

第三方库：requests

第三方库requests

Python-第三方库requests详解

Python开发——安装requests第三方库

Python——安装requests第三方库

Python 离线安装requests第三方库

python第三方库requests详解

python！安装第三方库requests

python第三方库requests简单介绍

python第三方库requests

python第三方库Requests的基本使用

python 第三方库网络 requests

Python：第三方库requests

Python的第三方库requests提示警告InsecureRequestWarning的问题

【Python、第三方库】对ID进行编码

Python导入第三方库问题

python的第三方库

python 第三方库

python第三方库

PyCharm安装第三方库如Requests

转：requests 第三方库文档

Requests 库 | 不可胜数的 Python 第三方库

python安装第三方包requests

python笔记：常用第三方模块—requests

python安装requests第三方模块

Window下安装Python第三方库requests。（python3+pycharm5）

利用python pip以及pyCharm安装requests第三方库

Python学习第三方库Requests: 让 HTTP 服务人类

Python如何安装requests等第三方库

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)