python 数字字符识别验证码

python 数字字符识别验证码

啊!之前有人写爬虫的时候问过我,当时我简单说了一下,但是没有具体说,今天稍微说一下,不是什么大问题。在写爬虫的时候有时候会遇到需要登录的情况,需要登录的时候只需要用户名密码还好,很多网站除了用户名密码还会要验证码,就是四位验证码五位验证码之类的东西,很多人遇到验证码的时候就不知道怎么处理了,其实很简单,有一个图像识别的库,叫“带带弟弟”,这个库经过了很多的图像识别学习,很厉害,一般的验证码都能识别出来。如果有条件的话,也可以自己去找模型自己训练,当然如果只是简单的验证码根本不需要,直接拿来用就可以了。

带带弟弟

这个库的名字感觉是个小菜鸡库,但是确实伪装成菜鸡的大佬!但是使用起来很简单。

这个库的全称是 “ddddocr”

然后安装一下,这个库比较大,所以说安装的时候要保证网络畅通!

pip install ddddocr

记住一点,这个库,只支持 3.9 版本及其以下的 python。如果是 3.10 版本的可能需要降级。

安装时间有点长,成功安装之后就可以直接使用了。

下面写一个小案例哈!

比如说我现在有一个验证码的图片1.png,然后我用这个库来识别一下。

在这里插入图片描述
执行代码之后直接数据结果,超级快。

在这里插入图片描述

再来几个!
在这里插入图片描述
发现识别准确率还是挺高的。
在这里插入图片描述

好了,就这样吧先。还有其他的玩法,可以直接看他的文档。

仓库:https://github.com/sml2h3/ddddocr

猜你喜欢

转载自blog.csdn.net/weixin_42776111/article/details/126745062
今日推荐