使用CDN的User-Agent反爬虫（附User-Agent恶意爬虫名单） - 代码天地

使用CDN的User-Agent反爬虫（附User-Agent恶意爬虫名单）

其他 2020-04-18 10:29:18 阅读次数: 0

我的主博客是可定博客(https://wnag.com.cn/)

原文链接：使用CDN的User-Agent反爬虫（附名单）

这几天发现CDN上的钱去的有点快，后台一查，有爬虫在后台爬了几千次，还是自己不认识的。因此如果你有用CDN的话，可以用CDN的User-Agent反爬虫。

这里以又拍云为例，CDN后台 - 访问控制 - User-Agent防盗链

附下一些恶意爬虫的名单：

*FeedDemon*
*BOT/0.1(BOTforJCE)*
*CrawlDaddy*
*Java*
*Jullo*
*Feedly*
*UniversalFeedParser*
*ApacheBench*
*Swiftbot*
*YandexBot*
*AhrefsBot*
*jikeSpider*
*MJ12bot*
*ZmEuphpmyadmin*
*WinHttp*
*EasouSpider*
*HttpClient*
*MicrosoftURLControl*
*YYSpider*
*jaunty*
*oBot*
*Python-urllib*
*IndyLibrary*
*FlightDeckReportsBot*
*LingueeBot*
*DotBot*
*SemrushBot*

参考：Nginx反爬虫：禁止某些User Agent抓取网站

特别声明：本文章原则上禁止转载，如确实要转载，请私信本博主，尊重劳动成果。

发布了13 篇原创文章 · 获赞 1 · 访问量 899

私信关注

猜你喜欢

转载自blog.csdn.net/Cordinovet/article/details/105566506

使用CDN的User-Agent反爬虫（附User-Agent恶意爬虫名单）

爬虫 User-Agent

python反爬虫，User-Agent方式

不止是User-Agent反爬虫

爬虫之User-Agent

Python 爬虫使用随机 User-Agent

网络爬虫的User-Agent和Proxy

爬虫时直接可用的User-Agent

Python 爬虫更改User-Agent

爬虫-User-Agent和代理池

python 爬虫 user-agent 生成

python 爬虫随机换user-agent

自己整理的模拟爬虫的user-agent

Python爬虫动态User-Agent

伪造进行爬虫，修改user-agent

python 爬虫随机获取User-Agent

Python爬虫开发：Request的使用（随机User-Agent）

python基于scrapy框架的网络爬虫程序反爬虫机制之User-Agent伪装

user-agent

User-Agent 汇总

获取User-Agent

User-Agent详解

User-Agent 合集

常用的User-Agent

User-Agent大全

Nginx/Apache恶意User-Agent过滤列表屏蔽蜘蛛爬虫

搜索引擎爬虫蜘蛛的User-Agent收集

Python爬虫电脑端User-Agent池接口

Python爬虫之浏览器User-Agent大全

python爬虫之如何随机更换User-Agent

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)