干货|Python爬虫如何设置代理IP - 代码天地

干货|Python爬虫如何设置代理IP

其他 2018-12-13 21:54:31 阅读次数: 0

在学习Python爬虫的时候，经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败。高强度、高效率地爬取网页信息常常会给网站服务器带来巨大压力，所以同一个IP反复爬取同一个网页，就很可能被封，这里讲述一个爬虫技巧，设置**代理IP**。
配置环境

安装requests库
安装bs4库
安装lxml库

具体代码
在这里插入图片描述
函数get_ip_list(url, headers)传入url和headers，最后返回一个IP列表，列表的元素类似122.114.31.177:808格式，这个列表包括国内髙匿代理IP网站首页所有IP地址和端口。
函数get_random_ip(ip_list)传入第一个函数得到的列表，返回一个随机的proxies，这个proxies可以传入到requests的get方法中，这样就可以做到每次运行都使用不同的IP访问被爬取的网站，有效地避免了真实IP被封的风险。
proxies的格式是一个字典：{‘http’: ‘http://122.114.31.177:808‘}，可以将下面的执行也封装为方法。
代理IP的使用
运行上面的代码会得到一个随机的proxies，把它直接传入requests的get方法中即可
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/li_zhi521/article/details/84027981

干货|Python爬虫如何设置代理IP

爬虫如何设置ua和代理ip

python爬虫中的ip代理设置

python爬虫——设置多个ip代理

PYTHON爬虫代理如何设置？用免费IP或IP池和REQUEST库爬取网页

爬虫-设置代理ip

爬虫代理IP设置

Python爬虫入门：如何设置代理IP进行网络爬取

Python 爬虫IP代理

python爬虫——代理IP

Python抓取数据如何设置爬虫ip

java爬虫(jsoup)如何设置http代理ip爬数据

爬虫ua设置及ip代理

【转载】【python3.x爬虫】设置IP代理

Python爬虫之scrapy框架中ip代理池的设置

python爬虫设置代理ip池——方法（一）

Python爬虫教程：如何使用Python获取免费代理IP

Python设置IP代理

python爬虫代理设置

【python3】如何建立爬虫代理ip池

Python爬虫如何实现IP代理池搭建

Python爬虫如何使用代理IP进行抓取

Python爬虫——使用代理IP

Python爬虫代理IP池

Python爬虫使用代理IP

python爬虫中代理ip

python 爬虫ip代理池

Python爬虫抓取代理IP并检验可用性,自动设置IE代理

[python爬虫]爬虫西刺ip代理

反爬虫之设置IP代理

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)