Python爬取网站HTML代码

其他 2018-09-26 07:46:11 阅读次数: 0

# -*- coding:UTF-8 -*-
import os
import os.path
import requests
def download(url):
	req = requests.get(url)
	req.encoding = 'utf-8'
	if req.status_code == 404:
		print("404错误")
	with open('String.txt','wb') as filename:
		filename.write(req.text.encode())
		print("下载完成")
if __name__ == '__main__':
	url = input("请输入URL: ")
	download('http://'+ url)

其中的重点是：

req.encoding = "utf-8" 如果没有这行代码，爬取下来的HTML将会是乱码

req.text.encode() 后面的这个 encode()是为了把bytes转为str

猜你喜欢

转载自blog.csdn.net/u011798443/article/details/80817935

Python爬取网站HTML代码

使用python爬取网站源代码

python爬取一个网站（一)--------下载html

python爬html网站

简单几行Python代码，爬取网站图片

14行Python代码轻松实现爬取网站视频

12行python代码爬取网站图片

用一串Python代码爬取网站数据

python爬取网站数据（含代码和讲解）

[Python]爬取mzitu网站

Python爬取网站数据

Python爬取网站图片

python 爬取网站图片

使用java爬虫爬取网站前台代码（html+css+js+img）

爬取网站招聘信息代码解析

python爬取视频代码

python爬取网站内容

Python爬取网站gif表情包

Python爬虫——爬取网站的图片

python爬虫爬取网站数据

python scrapy爬取网站数据一

Python爬取招聘网站

Python爬取斗图网站

python爬虫-爬取网站图片。

Python爬取网站美女照片

Python爬虫：爬取网站电影信息

Python爬虫爬取美剧网站

python 爬虫爬取某网站的漫画

python+selenium——爬取网站

Python爬虫爬取网站上的图片

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)