python网络爬虫——设置用户请求头 - 代码天地

python网络爬虫——设置用户请求头

其他 2018-09-04 17:04:29 阅读次数: 0

在使用python爬虫爬取数据的时候，经常会遇到一些网站的反爬虫措施，一般就是针对于headers中的User-Agent，如果没有对headers进行设置，User-Agent会声明自己是python脚本,而如果网站有反爬虫的想法的话，必然会拒绝这样的连接。而修改headers可以将自己的爬虫脚本伪装成浏览器的正常访问，来避免这一问题。

以爬取“豆瓣读书新书速递”（https://book.douban.com/latest?icn=index-latestbook-all）为例进行模拟浏览器君：

首先我们点击进入将要爬取的那个网页，然后鼠标右击页面，点击审查元素，将会出现下面的的框架，然后我们点击Network，然后刷新一下页面，便会出现如下图所示的信息了：

会发现第一行Name名称为我们要爬取网址的标号，点进去，点击上方Headers栏：

这时我们就可以根据上面的信息模拟浏览器君，在此我就可以设置users-agent，用requests库模拟浏览器君：

import requests

header = {'user-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}

response = requests.get(url,headers = header)

猜你喜欢

转载自blog.csdn.net/LOG_IN_ME/article/details/81940205

python网络爬虫——设置用户请求头

Python网络爬虫—请求头

python爬虫设置请求消息头(headers)

Python——爬虫【Requests设置请求头Headers】

Python爬虫笔记【一】模拟用户访问之设置请求头

Python爬虫请求头解析

爬虫：设置Request Header（请求头）

Python Selenium 请求头的设置

python爬虫网络请求

Python 爬虫进阶必备 | 某壁纸网站请求头参数与用户指纹 sign 加密逻辑分析

Pytrch爬虫实战学习笔记_2 网络请求urllib模块+设置请求头+Cookie+模拟登陆

【python爬虫】加密代理IP的使用与设置一套session请求头

Python爬虫：关于scrapy模块的请求头

Python Selenium WebDriver 如何设置请求头用户代理(User-Agent)参数

Python爬虫之网络请求

Python爬虫请求头、请求代理以及cookie操作

Python网络爬虫之网络请求

Python爬虫开发：post请求（用户登录）

cors 请求头设置

http请求头设置

selenium设置请求头

jQuery设置请求头

请求头的设置

httpclient设置请求头

axios设置请求头

Python爬虫：常用的user_agent请求头

python爬虫常用浏览器请求头

fake-useragent，python爬虫伪装请求头

python爬虫使用代理ip或请求头的问题

python爬虫小工具--快速获得请求头

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)