反爬虫的一些心得

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_39198406/article/details/84981293
  1. 转载请注明来源
  2. 本帖持续更新

1. 为什么会弹出验证码

访问频率太高,网站会针对性的弹出验证码限制你的访问,一般有这几种情况:

  1. 记录了你的IP访问频率,针对IP弹出验证码
  2. 记录了你的cookies访问频率,针对此账号弹出验证码
  3. 双管齐下,同时限制你的IP和账号的访问

2. 比较好的验证码设计

2.1 第一种

在这里插入图片描述
这种好像是谷歌的验证码生成库生成的中文验证码。
抛开大量样本的深度学习不说,这种验证码的难点在于:

  1. 干扰线粗,几乎和字符差不多,占面积大,难以使用一般的降噪算法解决;
  2. 干扰线和字体颜色多变,有时候为同一种颜色,无法使用颜色分离算法;
  3. 背景色跨度大,加上干扰线和字符颜色也多变,难以准确的消除背景。

特征:观察了若干样本,发现干扰线的颜色一致,长度也固定在某个范围,且基本上都会比汉字字符的笔画长。

3. 参数加密是怎么回事

猜你喜欢

转载自blog.csdn.net/weixin_39198406/article/details/84981293
今日推荐