scrapy框架中在middleware中进行配置user-agent,将user-agent进行随机

在scrapy中进行user-agent配置,将其进行随机更换。

下面所写为学习笔记

使用scrapy进行爬虫的时候,一些针对爬虫设置了一些反爬措施,最明显的是user-agent。

一、在setting文件中ctrl+f找到 DOWNLOADER_MIDDLEWARES,将其注释的部分取消掉,为了激活中间件。

这部分在scrapy文档中可以阅读到。

二、打开middlewares文件新建class类

class RandomUserAgentMiddlware(object):

三、调用super方法进行初始化

同时在setting中进行添加RANDOM_UA_TYPE=“random”

四、

猜你喜欢

转载自blog.csdn.net/lx516109011/article/details/83513489