python爬虫伪装浏览器 - 代码天地

python爬虫伪装浏览器

其他 2019-10-26 10:50:58 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/weixin_44913038/article/details/102648628

平时我们使用爬虫是都是直接用urllib库，就可以直接访问网页，爬取数据，但是有些网站会设置一些反爬机制，识别是浏览器还是爬虫，所以对于这些网站我们需要将网站伪装成浏览器进行访问

1、首先我们看一下浏览器访问的标识，打开一个浏览器，进入开发者模式，然后点击下面的network，再看下面的name下面很多个连接，随便点进去一个，在其右边，拉到最底下，可以看到user-agent：这就是这个浏览器的标识，不同浏览器的标识不同。
在这里插入图片描述
2、好了，接下来需要些伪装浏览器的代码，将上面的user agent这行全部复制下来，做成一个元组赋给headers，然后新建一个opener,将headers赋给opener,之后就可以使用opener打开网页，访问网页，爬取数据

import urllib.request

url = "https://blog.csdn.net"
#######伪装浏览器代码部分#######
headers = ("User-Agent","Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36")
opener = urllib.request.build_opener()
opener.addheaders = [headers]
#######伪装浏览器代码部分#######
data = opener.open(url).read().decode('utf-16-le','ignore')

猜你喜欢

转载自blog.csdn.net/weixin_44913038/article/details/102648628

python爬虫伪装浏览器

Python网络爬虫:伪装浏览器

python网络爬虫--浏览器伪装

python爬虫.2.伪装浏览器

Python爬虫3-----浏览器伪装

Python爬虫：Fiddler的使用和浏览器伪装技术

Python爬虫伪装浏览器，初步提取信息！

python学习笔记之（爬虫浏览器伪装）（四）

爬虫的浏览器伪装技术（019）

Requests爬虫之伪装浏览器

爬虫的浏览器伪装技术

爬虫--浏览器伪装技术（urllib）

[伪装浏览器报头]html爬虫伪装头

python学习，浏览器伪装

浏览器伪装

Python学习之爬虫05-爬虫的浏览器伪装技术实战

Python网络爬虫---爬虫的异常处理实战、浏览器伪装技术实战

爬虫基础-----爬虫的浏览器伪装技术

Python网络爬虫：自动模拟HTTP请求&爬虫的异常处理&爬虫浏览器伪装技术&新闻爬虫实战

python爬虫隐藏自身的ip并伪装成浏览器

Python数据挖掘学习笔记（8）爬虫异常处理与浏览器伪装

Python实现爬虫设置代理IP和伪装成浏览器的方法分享

Python爬虫+requests+伪装浏览器爬取小说入门总结

python—爬虫伪装成浏览器的三种方法

爬虫笔记（十二）——浏览器伪装技术

爬虫的浏览器伪装技术代码实例

用户代理列表--爬虫伪装浏览器访问用

爬虫02-简单伪装浏览器

伪装浏览器身份

python爬虫之美剧排行榜爬取(加浏览器伪装，代理，异常处理)

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)