常见的爬虫乱码的解决办法

企业开发 2023-06-11 19:39:55 阅读次数: 0

法一：设置response的encoding

import requests
res = requests.get("https://www.baidu.com/")
res.encoding = res.apparent_encoding
print(res.text)

法二：设置response的content解码

import requests
res = requests.get("https://www.baidu.com/")
txt = res.content.decode('gbk')

法三：使用chardet

import requests
import chardet
res = requests.get("https://www.baidu.com/")
encoding = chardet.detect(res.content)['encoding']
print(res.content.decode(encoding))

法四：使用cchardet

import requests
import cchardet
res = requests.get("https://www.baidu.com/")
encoding = cchardet.detect(res.content)['encoding']
print(res.content.decode(encoding))

法五：encode + decode

import requests
import cchardet
res = requests.get("https://www.baidu.com/")
res_encoding = res.encoding  # 响应的编码方式
con_encoding = cchardet.detect(res.content)['encoding']  # 内容的编码方式
print(res.text.encode(res_encoding).decode(con_encoding))  # 重新编解码text

猜你喜欢

转载自blog.csdn.net/m0_46521785/article/details/127116209

常见的爬虫乱码的解决办法

Python爬虫常见异常及解决办法

python爬虫出现乱码的解决办法

【Python3爬虫】常见反爬虫措施及解决办法（一）

【Python3爬虫】常见反爬虫措施及解决办法（二）

【Python3爬虫】常见反爬虫措施及解决办法（三）

Maven常见问题:下载Jar包乱码解决办法

常见的BUG---2、Hive中文注释乱码解决办法

Maven常见警告解决办法

hadoop常见错误及解决办法！

James 常见错误的解决办法

svn常见错误及解决办法

elasticsearch常见异常及解决办法

Nginx常见错误及解决办法

Hive常见的bug与解决办法

内存泄漏及常见的解决办法

Pycharm常见解决办法

常见异常的解决办法

常见的空指针及解决办法

pyinstaller 常见错误及解决办法

常见问题及解决办法

常见的反扒机制及解决办法

HTTPS常见错误及解决办法

css常见的bug及解决办法

常见的内存溢出与解决办法

CentOS 常见异常及解决办法

Python常见错误及解决办法

Freeswitch常见问题解决办法

myeclipse常见问题及解决办法

Hadoop常见问题及解决办法

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)