用urllib.request函数爬程序的需要decode一下，转换成utf-8 - 代码天地

用urllib.request函数爬程序的需要decode一下，转换成utf-8

其他 2018-08-12 22:53:11 阅读次数: 0

#从豆瓣网中爬出版社的程序https://read.douban.com/provider/all
#最后并写入TXT文件当中
import re
import urllib.request
'''pat = "pyth[jsh]n"
sting1 = "wodepythjn"
relt = re.search(pat,sting1)
print(relt)
'''
f = urllib.request.urlopen("https://read.douban.com/provider/all")
f1 = f.read()
#请求的response是需要重新编码的就用到decode函数
f1=f1.decode("utf-8")
pat1 = 'class="name">(.*?)</div>'
f2 = re.compile(pat1).findall(str(f1))
#怎样将列表写在文本文档中
fh = open("E:/新电脑学习/Python脚本/13.txt","w")
for i in range(0,len(f2)):
fh.write(fh[i]+"\n")
#用了fh.close之后才会在TXT文件中显示
fh.close()

又或者直接用

with open open("E:/新电脑学习/Python脚本/13.txt","w") as f

#就不用写fh.close()就可以保存到TXT文件里了

猜你喜欢

转载自blog.csdn.net/weixin_42099676/article/details/81318606

用urllib.request函数爬程序的需要decode一下，转换成utf-8

urllib.request encode()/decode()

字符串转换成UTF-8编码

将中文转换成utf-8的命令

UTF-8转换成GBK

字符串转换成UTF-8

用Python第一个爬虫程序（urllib.request)

编码encode，表现形式是转换成 bytes，实际转换成gbk或者utf-8

直接爬取gzip压缩过的网页，用decode（“utf-8“）无法读取html文档

python入门：UTF-8转换成GBK编码

当页面编码使用utf-8编码时，如何转换成中文？

java 中 16 进制 HEX 转换成字节码形式的 UTF-8

将目录下的所有文件从GBK转换成UTF-8

Java将文件转换成UTF-8无BOM格式

python在gbk编码转换成utf-8时乱码问题

Python:将utf-8格式的文件转换成gbk格式的文件

将iso-8859-1编码的字符串转换成utf-8

将GBK的文件转换成UTF-8的文件格式

python爬虫实践2：用urllib.request爬取天气网的图片

urllib2报错，用urllib.request来代替

python入门：简单模拟登陆时UTF-8转换成GBK编码

\r\n 如何转换成utf-8格式的，在jsp页面中正常显示换行

C# utf-8编码时转换成shift-jis时出现乱码问题的处理

urllib.request

urllib.request 学习

爬虫urllib.request

【爬虫】使用urllib.request去爬取小说

asp request utf-8转码函数

PDF怎么转换成word？必学PDF转换技巧分享一下

pdf怎么转换成word？办公常用pdf转换的方法分享一下

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

周排行

010-题目：利用条件运算符的嵌套来完成此题：学习成绩>=90分的同学用A表示，60-89分之间的用B表示，60分以下的用C表示。

接口测试-工作心得记录八（使用locust库书写接口并发）

物理分页和逻辑分页

Hive建表语句详解--CREATE TABLE

爬虫学习----学习get和post请求

PDF生成类库

POJ 2139

前端路由基本原理

I/O多路转接之epoll

.NET开源项目 QuarkDoc 一款自带极简主义属性的文档管理系统

每日归档

更多

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)