tesseract第三方图文验证码识别用法

一.tesseract的安装

在这里插入图片描述
下载这个压缩包即可
在这里插入图片描述

解压后直接双击文件夹内的.exe文件安装就好了,安装完后需要开始配置环境变量,就是把你安装tesseract的安装路径复制到环境变量中

在这里插入图片描述
在这里插入图片描述

在cmd里面输入如下代码,如果出现下方的4.00.00的版本号说明安装成功
在这里插入图片描述

二.在cmd中测试tesseact的识别率

下面我在cmd中来测试一下这个开源的验证码识别率,就以下面三张图片为例
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以看出此次识别与实际不一样
在这里插入图片描述第二张也未能识别

在这里插入图片描述此处才识别成功,可以看到这个开源的验证码识别器的识别率只有30%-50%左右

三.在pycharm中使用tesseract识别

在使用之前需要先安装两个库(pytesseract 和pillow)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四.总结

总结 : 通过以上测试这个开源的验证码识别率太低,所以我们在今后的数据抓取在需要验证码识别时,不推荐使用tesseract,在下一张我会给大家继续更新,去使用我们第三方的打码平台,它的识别率可以达到80%-90%,给个三连支持一下吧

猜你喜欢

转载自blog.csdn.net/qq_63713328/article/details/127537777