爬取一个网页保存到本地文件 - 代码天地

爬取一个网页保存到本地文件

其他 2018-12-09 20:45:04 阅读次数: 0

版权声明：未经同意窃取和转载我的内容，如果涉及到权益问题，后果自负！ https://blog.csdn.net/weixin_41605937/article/details/84261595

urllib.request.urlretrieve("http://www.youku.com/",filename="./网页/数据挖掘实例网页.html")

#这是网页下载到本地文件中
urllib.request.urlcleanup()

#清理缓存
file=urllib.request.urlopen("http://www.hellobi.com")
print("环境信息：",file.info())
# getcode()状态编码
# geturl()获取网页的函数
print(file.getcode())
print(file.geturl())

#解决网址中含有中文的乱码问题

keywd=urllib.request.quote（“中文”）

#模拟http请求通过post和get 两种方式来请求，比如登入和搜索的信息的时候可能会用到。

#爬虫的网址

html = "http://www.iqianyue.com/mypost/"

#设置表单数据

mydata=urllib.parse.urlencode({ "name":"[email protected]", "pass":"5695262623" }).encode("utf-8")

#设置请求

req=urllib.request.Request(html,mydata)

#提交的网址，提交的信息

data=urllib.request.urlopen(req).read()

#写入文件 fw=open("./作业二","wb")

fw.write(data)

fw.close()

猜你喜欢

转载自blog.csdn.net/weixin_41605937/article/details/84261595

爬取一个网页保存到本地文件

Java 爬取网页并保存到本地

Paython爬取网页所有图片并保存到本地

python爬取网页图片并保存到本地

爬取贴吧网页保存到本地文件夹中

【python爬虫】对喜马拉雅上一个专辑的音频进行爬取并保存到本地

Python使用requests爬取一个网页并保存

python爬虫爬取图片保存到本地文件

爬取图片并保存到本地

node.js 爬虫实现爬取网页图片并保存到本地

Scrapy爬取并保存到TXT文件

python爬虫实战一、爬取酷我音乐榜单并写入txt文件保存到本地

转 Jmeter如何把响应数据的结果保存到本地的一个文件

【网络编程】输入一个网址，获取网页内容，并保存到一个html文件中

爬取多态加载图片同时保存到本地指定文件夹

爬取校花图片保存到本地文件夹下（requests+re）

使用jsoup爬取网页信息，保存到txt中

学习笔记（爬虫）：爬取古诗网站，获取每一篇古诗，并保存到本地

scrapy框架爬取图片保存到本地或mongodb的写法

单页图片爬取--并保存到本地

python爬虫爬取图片并保存到本地

python爬取网站上的图片并保存到本地

将csdn的文章爬取，并将图片保存到本地

使用原生php爬取图片并保存到本地

使用Python爬取性感美女并保存到本地

爬虫爬取《全职法师》并保存到本地

爬虫实践小例子爬取书籍保存到本地

python爬取网站视频保存到本地

利用Jsoup爬取网站的图片，保存到本地

爬取图片实例python爬虫（保存到本地）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)