Python之Scrapy爬虫实战--绕过网站的反爬 - 代码天地

Python之Scrapy爬虫实战--绕过网站的反爬

其他 2020-02-15 11:25:44 阅读次数: 0

设置随机UA

修改middlewares.py

from fake_useragent import UserAgent

class RandomUserAgentMiddleware(object):
    def process_request(self, request, spider):
        ua = UserAgent()
        request.headers['User-Agent'] = ua.random

修改settings.py

# Enable or disable downloader middlewares
# See https://docs.scrapy.org/en/latest/topics/downloader-middleware.html
DOWNLOADER_MIDDLEWARES = {
   'scrapy_test.middlewares.RandomUserAgentMiddleware': 543,
}

设置IP代理

测试网站：http://icanhazip.com，网站可以返回当前请求的ip地址。

添加referer

default_headers = {
            'referer': 'https://www.baidu.com/',
        }

chen_mg

发布了21 篇原创文章 · 获赞 32 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_37676560/article/details/104204020

Python之Scrapy爬虫实战--绕过网站的反爬

python爬取网站数据，如何绕过反爬虫策略

Python之Scrapy爬虫实战--爬取妹子图

【反爬虫大全】爬虫学习者必须了解的当今各大网站反爬手段、反爬判断思路及绕过原理总结——以Python爬虫学习者的角度为例（长期更新...）

Python爬虫实战之爬取网站全部图片(一)

Python爬虫实战之爬取网站全部图片(二)

python爬虫之字体反爬

Python爬虫之Scrapy框架系列（14）——实战ZH小说爬取【多页爬取】

python3 scrapy实战：爬取猎聘网招聘数据至数据库（反爬虫）

python3 scrapy实战：爬取拉勾网招聘数据至数据库（反爬虫）

python3 scrapy实战：爬取直聘网招聘数据至数据库（反爬虫）

爬虫与反爬之-爬虫

python爬虫--爬虫与反爬

python3 + Scrapy爬虫学习之腾讯实战爬取

Python网络爬虫反爬破解策略实战

Python爬虫实战——反爬机制的解决策略【阿里】

python爬虫--scrapy爬取腾讯招聘网站

scrapy豆瓣实战反爬机制（转）

SVG反爬虫绕过-Python Spider

CSS混淆反爬虫绕过-Python

SVG反爬虫绕过-Python Spider

CSS混淆反爬虫绕过-Python

Python爬虫实战：Scrapy豆瓣电影爬取

Python爬虫实战使用scrapy与selenium来爬取数据

python爬虫之爬取网站图片

python爬虫之爬取网站小说

python3爬虫系列20之反爬需要登录的网站三种处理方式

网络爬虫-绕过debugger反爬（Paused in debugger）

网络爬虫-pyqt5绕过反爬服务

Python之Scrapy爬虫实战--新建scrapy项目

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)