关于爬虫验证码识别的思路

其他 2018-12-17 10:20:54 阅读次数: 0

版权声明： https://blog.csdn.net/qq_36874292/article/details/84977044

爬虫持续工作

越过验证码的本质问题都是想登陆网站

思路提供

越过验证码的本质问题都是想登陆网站

对于很多 baidu/google 上的相关博客,多是关于xx验证码怎么识别,xxx框架的验证码识别效率等等问题.在这里我特别想告诉读者关于这个问题的几种解决方案 通过这些解决方案的分析,我认为你应该找到了最适合自己的了.

思路提供

1、绕过验证码。跳过验证码直接访问需要的页面内容。
2、请求头中自带验证码。有些网站的验证码会在前台 js 校验。服务器生成的验证码会在请求头中。可以获取请求头，并把验证码解析出来。
3、session 不刷新。有的网站验证码验证成功后，直接获取请求资源。（忘记了刷新 cookie 对应的验证码）可以预先设定一个 cookie 和验证码。利用这个漏洞访问网站。对于多线程无法控制以及有些网站验证码定期不访问失效问题。可以添加一个定时访问程序来解决。
4、利用第三方插件。
对于有些网站验证码比较简单。只含阿拉伯数字和英文字母。可以用第三方的插件来识别。例如：tess4j、tesseract 。
对于有些网站验证码比较复杂.利用训练库,和利用第三方训练库帮助训练.然后使用.如,Tess4j,对于知识要求可能较高.
5、有些网站的验证码是从库中随机取出一个来的。对于这类静态的验证码。可以自己建立一个验证码静态库。自己建立好图片和验证码答案的链接。采用 map 的映射方法就可以进行识别。
6、调用第三方API,baiduAPI,腾讯API等使用(不是特别推荐)

猜你喜欢

转载自blog.csdn.net/qq_36874292/article/details/84977044

关于爬虫验证码识别的思路

验证码的识别的几种思路

车牌识别及验证码识别的一般思路

爬虫验证码识别

爬虫验证码的识别

java使用工厂模式来完成验证码识别的思路

UI自动化关于图片验证码识别的解决方法

爬虫—GEETEST滑动验证码识别

Python爬虫之验证码识别

爬虫之识别验证码组件

Python 爬虫云验证码识别

Python爬虫之验证码的识别

爬虫学习-验证码识别

爬虫验证码解决思路 Python爬虫四种验证码的解决思路

python爬虫中关于弹窗和验证码解决思路！

python 爬虫 pytesseract 验证码识别：识别拉勾网验证码

验证码识别一般思路

使用TensorFlow进行验证码识别主要实现思路

Python爬虫四种验证码的解决思路

Python爬虫的4种验证码解决思路

【老男该】爬虫学习笔记P29-P33.验证码的识别的简介云打码使用流程，古诗文验证码的识别人人网模拟登录

识别验证码

验证码识别

验证码识别

网络爬虫以及自动化测试中图形验证码识别解决思路以及方法

爬虫中遇到登录验证码，java 如何识别图片验证码

python爬虫高级技术之验证码篇-滑动验证码识别技术!

数据抓取之反爬虫规则：验证码识别

Python爬虫模拟登录(六)：验证码识别一

[Python][爬虫]利用OCR技术识别图形验证码

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)