Python-反爬篇 - 代码天地

Python-反爬篇

其他 2021-03-28 20:49:56 阅读次数: 0

使用fake_useragent随机构建UserAgent

from fake_useragent import UserAgent

ua = UserAgent(verify_ssl=False)
def get_header():
    return {
    
    
        'User-Agent': ua.random
    }

使用代理池

import requests

#  首先需要配置代理池，具体见：https://github.com/Python3WebSpider/PorxyPool

def get_proxy():
    proxypool_url = 'http://127.0.0.1:5555/random'
    proxies = {
    
    'http': 'http://' + requests.get(proxypool_url).text.strip()}
    return proxies

使用time.sleep()

import time

# 以上方法加上适当的sleep，基本不会出错

time.sleep(0.1)  # 以s为单位

实践

import requests

url = 'https://m.weibo.cn/'
time.sleep(0.1)
resp = requests.get(url,headers=get_header(),proxies=get_proxy())

问题

批量爬取微博信息的时候还是会出现418错误，目前的措施只能相对减少418的产生。

猜你喜欢

转载自blog.csdn.net/MaoziYa/article/details/106658607

Python-反爬篇

Python-爬虫代理--proxy（反爬）

python-反爬虫

Python-爬爬爬虫

练习python反爬

Python爬虫自学之第（①）篇——爬虫伪装和反“反爬”

签名验证反爬，反反爬第二篇博客，Python爬虫120例

python-爬猫眼电影

python-（scrapy下）如何反爬虫

python爬虫--爬虫与反爬

Python爬虫之路-反爬与反反爬

Python爬虫入门教程 62-100 30岁了，想找点文献提高自己，还被反爬了，Python搞起，反爬第2篇

Python爬虫入门教程 63-100 Python字体反爬之一，没办法，这个必须写，反爬第3篇

python-爬取淘宝商品

python爬虫——爬虫伪装和反“反爬”

解决简单的反爬问题（使用python）

python反爬之用户代理

python反爬之懒加载

python爬虫与反爬、加密算法

Python爬虫---猫眼字体反爬

python爬虫--cookie反爬处理

Python 体赛websocket反爬破解

python爬虫之字体反爬

python爬虫js反爬案例

python爬虫采集反爬策略

【python】——爬虫05 初级反爬笔记

python爬虫字体反爬实习僧

Python爬虫｜反爬初体验

Python爬虫编程12——字体反爬

Python爬虫编程11——JS反爬

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)