初次接触python爬虫requests.get涉及的UA（浏览器标识信息）问题 - 代码天地

初次接触python爬虫requests.get涉及的UA（浏览器标识信息）问题

其他 2018-05-07 16:12:15 阅读次数: 4

初次接触学习崔大神的python爬虫时候，其中利用requests.get进行网页抓取时候涉及UA（浏览器标识信息）问题。开始没有看明白，大神也只是简单提示爬虫的时候必须添加，其他息没有提示。最后自己给也给忽视了。

今天学习别人的爬虫代码，又碰到了上面类似的 UA 代码，不理解。所以百度了下，下面分享下，供IT小白同道人参考。

1.什么是UA

User Agent中文名为用户代理，简称 UA，它是一个特殊字符串头，使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。

具体可以快速了解下百度百科吧。点击打开链接

2.爬虫时候提供UA的作用（百度转载别人的。。。）

通过这个标识，用户所访问的网站可以显示不同的排版，从而为用户提供更好的体验或者进行信息统计。例如，百度、新浪等网站用手机访问和电脑访问是不一样的，这是因为网站根据访问者的UA判断后，进行了不同的设置和处理。
使用User-Agent伪造浏览器，谎称身份欺骗服务器IE,FireFox,Opera,Maxthon,Chrome,Safari,iPhone，ipad..qq空间说说，微薄转发，有个通过ipad发布。。通过iphone..就是读取User-Agent，当然这个可以伪装的
用于seo,有一种SEO的技术，就是判断 user-agent，如果是搜索引擎的爬虫，就把内容显示出来，否则的话，只显示给付费用户。所以有的网站能够被Google搜索到，点击链接进去以后却显示“未注册”、“还不是会员”。通过伪装user-agent可以达到相应的目的。。

3.如何自己获取自己浏览器的UA

扫描二维码关注公众号，回复： 151074 查看本文章

1.地址栏中输入：about:version（推荐方法,亲测可用）
2. 地址栏中输入：javascript:alert(navigator.userAgent) （没成功。。。可能网络连接问题
3. 另附两个在线获取的网站：（亲测可用）

http://www.useragentstring.com/

http://tools.jb51.net/table/useragent

猜你喜欢

转载自blog.csdn.net/myself029/article/details/79981272

初次接触python爬虫requests.get涉及的UA（浏览器标识信息）问题

python爬虫一：requests.get()

浏览器标识ua

python 网站爬虫（一） requests.get()方法应用

浏览器UA，浏览器标识检测

关于python中requests.get()中网址问题

requests.get爬虫模块参数

利用python爬虫(part13)--requests模块之requests.get的参数们

python requests.get()下载文件

requests.get

Python爬虫教程-10-UserAgent和常见浏览器UA值

Requests爬虫之伪装浏览器

requests.get中response乱码问题---编码问题

使用requests.get下载大文件－Python

Python爬虫伪装浏览器，初步提取信息！

Python爬虫+requests+伪装浏览器爬取小说入门总结

爬虫-初次接触

requests.get()状态码418

JS识别浏览器终端UA

【常见浏览器的UA】

常用各个浏览器UA

通过设置ua模拟浏览器

C#实现-浏览器UA解析获得手机、系统、浏览器等信息

Python爬虫 —— urllib库的使用（get/post请求+模拟超时/浏览器）

浏览器内核标识

python爬虫之selenium库，浏览器访问搜索页面并提取信息，及隐藏浏览器运行

前端浏览器 UA 客户端信息识别模块 -- uadetector

python3中request.urlopen()和requests.get()方法的区别

转发：python中的网页爬取函数requests.get（）和urlopen函数的区别

Python中requests.get响应内容中文乱码解决方案

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)