爬虫被封IP了怎么办-爬虫与反爬虫的“世世情缘” - 代码天地

爬虫被封IP了怎么办-爬虫与反爬虫的“世世情缘”

其他 2019-01-03 10:48:40 阅读次数: 0

原因就在于爬虫本身的功能是不难的，真正显示技术的是应对反爬虫技术。说到反爬虫最简单的应对方式就是封锁IP。

那么为什么封锁IP是有效果的呢？

一次网页的请求含有很多的信息，比如UserAgent，比如Cookie。之所以说封锁IP最有效是因为其他的信息都可以进行伪造，但是唯独http的请求中是没有办法直接伪造IP的，

http协议基于tcp，而tcp协议存在握手机制的，这样你就根本美哟办法使用假的IP来链接。

那么如何封锁IP

我们从年龄比较大的论坛程序看起Discuz的反爬功能-防采集：

简单粗暴的制定规则，一个IP的访问次数就是几次，超过多少次就封锁。假设默认访问次数200次，那么也即是说一个IP超过200次的访问量就会被计入黑名单。

实现的方式比制定的方式还要粗暴，对于大部分语言来说，获取ip地址都是很简单的，获取到ip之后，将ip作为主键存入数据库中。

最后再加一个字段来记录访问次数就可以了。当然当我们每天ip数量很多的时候，我们可以考虑存入非关系型数据库中，毕竟我们只需要key-value形式的数据，用关系型数据库反倒浪费了。

3.我是爬虫，前方禁止通行，该位置已经封锁

爬虫和反爬虫世世代代都是冤孽，解决爬虫被封问题已经成为所有爬虫工作者毕竟的磨难，那么下面就说说IP怎么来的

1、自己建立IP爬虫渠道：可以，但是耗时耶消耗精力，你要是觉得你有那么经历你就弄

2、淘宝：也可以，但是重复率高了点，稳定性差了点，不敢保证安全性是不是很好

3、代理IP服务商：建议购买代理IP，市面上IP代理商比较多，安全性，稳定性也都可以保障。犀牛代理IP海量IP代理池，安全稳定，保障数据安全和上网隐私

猜你喜欢

转载自www.cnblogs.com/xiniudaili/p/10212802.html

爬虫被封IP了怎么办-爬虫与反爬虫的“世世情缘”

python爬虫遇到IP被封的情况，怎么办？

十年爬虫经验告诉你爬虫被封怎么办

爬虫中代理IP怎么使用的，失效了怎么办？

用代理IP爬虫遇到问题怎么办

购买的代理ip被网站判定为爬虫，怎么办？

遇到爬虫、接口盗刷怎么办？反爬虫组件来助你

反爬虫技术之防止IP地址被封杀

爬虫遇到521错误怎么办

python爬虫防止IP被封

Python写个爬虫碰到反爬了，怎么办那就动手破坏它！

爬虫遇到反爬机制怎么办? 看看我是如何解决的！

用爬虫代理ip会被封号吗？怎么解决？

避免网络爬虫IP被封的策略

爬虫之遇到403 Forbidden,你该怎么办？

Java 爬虫遇到需要登录的网站，该怎么办？

网站遇到Bytespider爬虫该怎么办？

Python爬虫，请求参数加密怎么办？

服务器被爬虫恶意攻击怎么办？

Python反爬虫技术之防止IP地址被封杀的讲解

爬虫——Python爬虫遇到ip被封或Max retries exceeded问题

网络爬虫怎么应对反爬虫机制

反爬虫2（代理ip）

网络爬虫反爬虫

爬虫与反爬虫

爬虫VS反爬虫

爬虫反爬虫

Python的爬虫与反爬虫

scrapy爬虫与反爬虫

爬虫反爬虫

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)