反爬虫之设置IP代理 - 代码天地

反爬虫之设置IP代理

其他 2019-03-05 11:53:06 阅读次数: 0

通过上一章节,了解到可以设置多个模拟浏览器代理来随机去访问获取页面内容,但是始终只有一个IP地址用来访问,时间长了同样也会被网站封掉.所以设置多个IP代理进行访问成为一种反爬虫的更好策略.即通过让其他的IP代替你的IP进行网站的访问。

如何获取代理IP？

https://www.xicidaili.com/ (西刺代理网站提供)

如何检测代理是否成功?

http://httpbin.org/get

示例

from urllib.request import ProxyHandler, build_opener, install_opener, urlopen
from urllib import  request




def use_proxy(proxies, url):
    # 1. 调用urllib.request.ProxyHandler
    proxy_support = ProxyHandler(proxies=proxies)
    # 2. Opener 类似于urlopen
    opener = build_opener(proxy_support)
    # 3. 安装Opener
    install_opener(opener)

    # user_agent =  "Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0"
    # user_agent =  "Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0"
    user_agent = 'Mozilla/5.0 (iPad; CPU OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A334 Safari/7534.48.3'
    # 模拟浏览器;
    opener.addheaders = [('User-agent', user_agent)]
    urlObj = urlopen(url)
    content = urlObj.read().decode('utf-8')
    return  content

if __name__ == '__main__':
    url = 'http://httpbin.org/get'
    proxies = {'https': "111.177.178.167:9999", 'http': '114.249.118.221:9000'}
    use_proxy(proxies, url)

猜你喜欢

转载自blog.csdn.net/qq_43279936/article/details/88134921

反爬虫之设置IP代理

反爬虫之搭建IP代理池

动态ip代理：反网络爬虫之设置User-Agent的常规方法

反爬虫2（代理ip）

C#攻克反爬虫之代理IP爬取

爬虫-设置代理ip

爬虫代理IP设置

python爬虫之反爬虫（随机user-agent，获取代理ip，检测代理ip可用性）

应对反爬虫策略：使用代理IP、设置请求头、请求频率限制等

爬虫ua设置及ip代理

Python爬虫之scrapy框架中ip代理池的设置

干货|Python爬虫如何设置代理IP

爬虫如何设置ua和代理ip

java爬虫常用设置代理IP教程

python爬虫中的ip代理设置

python爬虫——设置多个ip代理

python3爬虫系列19之反爬随机 User-Agent 和 ip代理池的使用

爬虫IP代理-设置ADSl拨号服务器代理

Python网络爬虫之ProxyHandler处理器（IP代理设置）

python编程技术：Python爬虫常用小技巧之设置代理IP

Python之爬虫搭建代理ip池

反爬虫技术之防止IP地址被封杀

python爬虫-python之爬虫的代理ip池建立

处理反爬措施（随机请求头、ip代理、超时设置、延时设置）

java爬虫(jsoup)如何设置http代理ip爬数据

【转载】【python3.x爬虫】设置IP代理

python爬虫设置代理ip池——方法（一）

代理ip的设置配合requests库实现爬虫

这就是我的爬虫基本功！使用代理 IP和绕过反爬机制！

京东全网爬虫（scrapy_redis分布式，IP代理池反爬）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)