scrapy 设置ip代理 - 代码天地

scrapy 设置ip代理

其他 2018-07-21 06:40:11 阅读次数: 0

1.

修改middlewares.py中****Dowmloadermiddleware中process_request方法

class Books2DownloaderMiddleware(object):
    # Not all methods need to be defined. If a method is not defined,
    # scrapy acts as if the downloader middleware does not modify the
    # passed objects.
    requestIP=[{"ipaddr": "111.155.116.237:8123"},
               {"ipaddr": "101.236.23.202:8866"},
               ]（ip来源：西刺代理）
    @classmethod
    def from_crawler(cls, crawler):
        # This method is used by Scrapy to create your spiders.
        s = cls()
        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
        return s
    #下载器的中间键，存在于引擎与下载器之间
    def process_request(self, request, spider):
        # Called for each request that goes through the downloader
        # middleware.
        # Must either:
        # - return None: continue processing this request
        # - or return a Response object
        # - or return a Request object
        # - or raise IgnoreRequest: process_exception() methods of
        #   installed downloader middleware will be called
        currentIP=random.choice(self.requestIP)
        print("currentIP:" + currentIP["ipaddr"])
        request.meta["proxy"] = "http://" + currentIP["ipaddr"]

2.在settings.py文件中，把

DOWNLOADER_MIDDLEWARES = {
   'books2.middlewares.Books2DownloaderMiddleware': 543,
}放开即可

3.效果：

ip不稳定时：

猜你喜欢

转载自blog.csdn.net/rookie_is_me/article/details/81001083

scrapy 设置ip代理

设置代理 IP | Requests & Scrapy

给scrapy添加代理IP

scrapy IP代理池

Scrapy:测试代理ip

Scrapy 代理IP

scrapy ip 代理操作

Scrapy学习篇（十二）之设置随机IP代理（IPProxy）

Python爬虫之scrapy框架中ip代理池的设置

scrapy user-agent和IP 代理的设置

scrapy 框架代理设置

scrapy中设置IP代理池（自定义IP代理池）

pyhton2爬虫爬IP IP代理池 urllib2设置 scrapy设置

Scrapy使用IP代理池

python小白学习记录 scrapy设置随机请求头设置免费代理ip

scrapy代理

scrapy框架设置代理IP 和日志输出控制案例

scrapy中间件(fake_useragent使用 + ip代理设置)

scrapy爬取可用的代理ip

Requests 和 Scrapy 添加动态IP代理

scrapy下使用ip代理的方法

Scrapy反爬机制——ip代理池

随机IP代理插件Scrapy-Proxies

scrapy爬虫-代理IP中间件

【Scrapy学习心得】添加IP代理

scrapy代理ip池中间件

爬虫 - scrapy框架设置代理

Scrapy中Chrome和PhantomJS设置代理

scrapy设置随机请求头和代理

Scrapy设置User-Agent随机代理

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)