python爬虫隐藏自身的ip并伪装成浏览器 - 代码天地

python爬虫隐藏自身的ip并伪装成浏览器

其他 2018-08-01 05:11:04 阅读次数: 0

摘自:https://blog.csdn.net/jasonLee_lijiaqi/article/details/79384777

爬虫隐藏自身的ip并伪装成浏览器

１、使用代理访问

就是说使用代理Ｉｐ,代理ｉｐ访问url之后，再将网页的内容在传给本机的ｉｐ；

'''
使用代理访问
'''
import urllib.request
import random

url = 'http://www.whatismyip.com.tw'

#创建一个ｉｐｌｉｓｔ，随机使用ｉｐ
iplist = ['219.223.251.173:3128','203.174.112.13:3128','122.72.18.34:80']
#创建一个代理opener
proxy_support = urllib.request.ProxyHandler({'http':iplist[random.randint(0, len(iplist))]})
opener = urllib.request.build_opener(proxy_support)

#添加浏览器的伪装头部
opener.addheaders = [('User-Agent','Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:58.0) Gecko/20100101 Firefox/58.0')]

#使用代理ｏｐｅｎｅｒ访问url
response = opener.open(url)


html = response.read().decode('utf-8')
print(html)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

2、伪装成浏览器

隐藏————伪装成浏览器
两种方法：
１、通过Request的headers参数修改
２、通过Request.add_header()方法修改
在User-Agent中替换成浏览器的User-Agent

'''
import urllib.request

url = r'http://douban.com'
headers = {'User-Agent':'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:58.0) Gecko/20100101 Firefox/58.0'}

#urllib.request.Request（）用于向服务端发送请求，就如 http 协议客户端向服务端发送请求 POST
#添加了一个头部，伪装成浏览器,此时的url并不是一个裸露的url，而是具有header头部的url
req = urllib.request.Request(url=url, headers=headers)

#urllib.request.urlopen（）则相当于服务器返回的响应,返回的是一个request类的一个对象， GET
# 类似于一个文件对象，可以进行ｏｐｅｎ()操作获取内容
res = urllib.request.urlopen(req)

html = res.read().decode('utf-8')
print(html)

猜你喜欢

转载自blog.csdn.net/qq_38712932/article/details/80426181

python爬虫隐藏自身的ip并伪装成浏览器

Python实现爬虫设置代理IP和伪装成浏览器的方法分享

python—爬虫伪装成浏览器的三种方法

玩爬虫的时候记得伪装成浏览器！这样就不可能被封了哦！

使用Python Requests伪装成浏览器请求百度360获取关键词批量排名

Python爬虫技术：爬虫时如何知道是否代理ip伪装成功？

Python爬虫——爬虫时如何知道是否代理ip伪装成功？

Firefox修改UserAgent伪装成手机浏览器

（python爬虫时）如何知道是否代理ip伪装成功

python爬虫时如何知道是否代理ip伪装成功

python爬虫伪装浏览器

Python网络爬虫:伪装浏览器

python网络爬虫--浏览器伪装

一周搞定scrapy之2，伪装成浏览器及用css提取数据

python爬虫.2.伪装浏览器

Python爬虫3-----浏览器伪装

Python爬虫：Fiddler的使用和浏览器伪装技术

Python爬虫伪装浏览器，初步提取信息！

python学习笔记之（爬虫浏览器伪装）（四）

爬虫的浏览器伪装技术（019）

Requests爬虫之伪装浏览器

爬虫的浏览器伪装技术

爬虫--浏览器伪装技术（urllib）

[伪装浏览器报头]html爬虫伪装头

python学习，浏览器伪装

浏览器伪装

Python学习之爬虫05-爬虫的浏览器伪装技术实战

Python网络爬虫---爬虫的异常处理实战、浏览器伪装技术实战

爬虫基础-----爬虫的浏览器伪装技术

Python网络爬虫：自动模拟HTTP请求&爬虫的异常处理&爬虫浏览器伪装技术&新闻爬虫实战

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)