Python3 html获取 - 代码天地

Python3 html获取

其他 2018-12-03 05:10:50 阅读次数: 0

版权声明： https://blog.csdn.net/hhq2lcl/article/details/78652334

import urllib.request #导入urllib库的request模块

#指定要抓取的网页url，必须以http开头的
url='http://blog.csdn.net/u014453898/article/details/54848707'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}

#调用 urlopen（）从服务器获取网页响应（respone），其返回的响应是一个实例
respone=urllib.request.urlopen(url)

#调用返回响应示例中的read（）函数，即可以读取html，但需要进行解码，
#具体解码写什么，要在你要爬取的网址右键，查看源代码;如‘utf-8’
html=respone.read().decode('utf-8')
'''# print(respone.info())——info()获取编码方式 #'''
urllib.request.urlretrieve(url,'./html_doc.txt')

猜你喜欢

转载自blog.csdn.net/hhq2lcl/article/details/78652334

Python3 html获取

python3 spider 02 获取html的url、 head、 status

python3 获取html内容中的a链接与内容

Python3 操作HTML

【Python3】HTML基础

python3 获取cookie

Python3正则去掉HTML标签

python3 接口获取数据

python3自动获取网站的cookie

Python3获取ECS相关信息

python3获取自己ip

Python3获取代理IP

python3 图片获取与保存

python3 获取子进程的name

python3 获取header和data

python3获取各种时间

python3 获取日期时间

Python3获取谷歌翻译

Python3 获取&判断文件后缀

python3获取请求cookie

python3 根据ip获取国家

python3 获取int最大值 python3 获取int最大值

python3 发送邮件（二）（html）（qq）

【二】Python3使用SMTP发送HTML格式的邮件

Python3之处理HTML转义字符

python3 csv,txt,html转成pdf(windows)

Python3之正则清除html标签

Python3爬虫抓取网页的html 保存

Python3 HTML数据解析(lxml/BeautifulSoup/JsonPath)

python3 如何修改html文件的标签属性值

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)