python3解决爬取网页中文显示为16进制数的问题 - 代码天地

python3解决爬取网页中文显示为16进制数的问题

其他 2018-08-10 04:38:26 阅读次数: 0

最近发现一个问题，网页爬取出来的中文显示为十六进制。代码如下：

import urllib.request as rst
import re
import requests
response = rst.urlopen('http://hq.sinajs.cn/list=s_sz000001')
print("dest text=", stockStr)

结果如下：

dest text= b'var hq_str_s_sz000001="\xc6\xbd\xb0\xb2\xd2\xf8\xd0\xd0,8.88,0.00,0.00,603378,53540";\n'

我试着改为utf8的编码，结果报错了。

print("dest text=", stockStr.decode('utf-8'))

提示解码失败：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 25: invalid start byte

后来我想，这个网页可能不是utf8编码的。于是查看了网页的编码。

import urllib.request as rst
import re
import requests
res=requests.get('http://hq.sinajs.cn/list=s_sz000001')
print(res.encoding)

发现编码是gbk。

于是解码为gbk就搞定了。

print("dest text=", stockStr.decode('gbk'))

显示结果如下：

dest text= var hq_str_s_sz000001="平安银行,8.88,0.00,0.00,603378,53540";

猜你喜欢

转载自blog.csdn.net/eagle1024/article/details/81036021

python3解决爬取网页中文显示为16进制数的问题

python爬取网页中文乱码。解决方案。python3

python3爬取网页图片

python3 爬取天气网页

python3爬虫爬取网页思路及常见问题（原创）

python3爬虫爬取网页图片简单示例

python3爬虫之二：爬取网页图片

python3 爬取36氪新闻网页

Python3 -- 基于Splinter工具爬取网页资源

python3 从网页上爬取图片

python3定向爬取网页内容

python3 url 爬取网页并读写

Python3 爬取Ajax加载的网页信息

Python3 Ajax加载的网页爬取

python3 爬取网页表格例子

python3 爬取网页的异常处理

python3爬取网页图片路径并写入文件

python3爬取网页中的邮箱地址

Python3 使用request模块爬取网页的图片

Python3 使用urllib 爬取网页

python3：爬取的内容包含中文，输出后乱码的问题

解决python 保存json到文件时中文显示16进制编码的问题

Python3爬取京东商品数据，解决赖加载问题

爬取网页中文乱码的问题

python3爬取女神图片，破解盗链问题

python爬虫——爬取网页的中文

怎么用Python Flask模板jinja2在网页上打印显示16进制数？

Mac系统下anaconda的Python3中的matplotlib的中文显示问题解决

解决Windows下python3 matplotlib无法显示中文问题

用python2和python3伪装浏览器爬取网页

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)