网站的常见反爬方法总结

其他 2020-03-19 15:32:29 阅读次数: 0

前言

本人学习网络爬虫有一段时间了，也爬了不少网站。在这期间，我遇到了很多的反爬措施，个人觉得爬虫与反爬虫就像矛和盾一样，矛强大了，盾也必然会升级，有点魔高一尺道高一丈的感觉。今天，我就总结一下我遇到的一些反爬策略。

正文

1、在请求头做限制，其中最长见的就是user-agent，如果你的爬虫不进行请求头伪装，那么网站不会给你返回数据，还有些网站会判断referer和请求头的其他一些字段。

2、验证码，这个一直是令人比较头疼的问题，当你请求次数过多或者请求过于频繁时，网站直接给你弹个验证码，导致你不能继续获取数据，那些图片验证码还比较好解决，但是像那些滑动的验证码就比较棘手了。当然，你可以用代理IP来解决这个问题，或者降低爬虫的爬取速度。

3、特殊字体，这个是我爬大众点评时遇到的，直接查看网页源代码会发现有些字不能显示，还有一些乱码。

4、数据加密，这个也挺头疼的，你拿到的数据是加密的，需要去分析JS代码，找出解密的方法。

5、前端页面反调试，当你企图分析网站页面时，发现无法进行调试。

后记

暂时就遇到这么多了，以后会继续更新。

未完待续

虐猫人薛定谔i

发布了187 篇原创文章 · 获赞 289 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/Deep___Learning/article/details/104625614

网站的常见反爬方法总结

【解决】常见反爬总结之SVG映射

常见的反爬策略及其破解方法

Python | 常见的反爬及解决方法，值得收藏

常见的反爬虫技术有哪些？如何防止别人爬自己的网站？

【转载】爬虫常见反爬思路

常见的反爬措施：UA反爬和Cookie反爬

04_两种常见的网页反爬措施及应对方法

反爬虫常见策略总结

常见反爬虫方法及绕过策略

常见的反爬手段和解决思路

常见的反爬机制及应对策略

关于爬虫的常见反爬及处理方式

5种常见反爬策略及解决方案

python爬虫笔记（十）爬虫常见的反爬策略和反爬攻克手段

前端网站常见的优化方案总结

网站反爬方案分析

Python爬取网站图片的2种常见处理

常见的反爬虫和应对方法

python爬虫－常见反爬虫机制与应对方法

python常见的反爬虫和应对方法？

常见的判断网站cms方法

提高网站性能的常见方法

网站攻击常见方法及处理

python 爬虫（八）常见的反爬措施以及应对措施（爬虫必备）+ 动态Html页面的处理方法 + selenium+PhantomJS的介绍及安装

网站有反爬机制你的爬虫功夫就不好使了？那是你不会反反爬！【Python解决网站的反爬机制战略总结】

【那些反爬与反反爬】网页中嵌入随机不可见字符的解决方法

爬虫提高 - 1 - 常见的反爬手段和解决思路

十六、常见的反爬手段和解决思路

4个小例子帮助你理解常见反爬措施与应对技巧

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)