python爬虫之OCR验证码识别

其他 2018-09-11 21:42:47 阅读次数: 0

OCR验证码初探
http://my.cnki.net/elibregister/CheckCode.aspx 随机获取验证码保存到项目的根目录下

今天第写一个简单的验证码识别例子小伙伴说识别出来的跟预想的不一样，主要是我写的例子验证的图片比较简单，而小伙伴识别的图片内有多余的线条干扰了图片的识别。对于这种情况我们需要对图片进行一下处理，例如转灰度、二值化等操作。

把图片保存到项目的根目录下并且图片修改为后缀是.jpg的格式
上代码：
import tesserocr
from PIL import Image

image = Image.open(‘Code.jpg’)

将图片转化为灰度图像

image=image.convert(‘L’)
image.show()

阈值转化为127

threshold =127
table = []
for n in range(256):
if n < threshold:
table.append(0)
else:
table.append(1)

image = image.point(table , ‘1’)
result = tesserocr.image_to_text(image)
print(result)

我这里就可以识别出来了，但是有的识别出来的还有误差，那就需要修改一下

阈值转化为127

threshold =127

127的值需要修改，修改为能识别的合适的值为止

猜你喜欢

转载自blog.csdn.net/weixin_43102784/article/details/82263187

python爬虫之OCR验证码识别

[Python][爬虫]利用OCR技术识别图形验证码

〖Python网络爬虫实战㉞〗- 图形验证码OCR识别

Python爬虫之验证码识别

Python爬虫之验证码的识别

python爬虫学习：验证码之OCR

OCR识别验证码

Python爬虫之网站验证码识别（三）

Python爬虫教程-29-验证码识别-Tesseract-OCR

验证码识别，用Python进行图文识别（OCR）

python爬虫高级技术之验证码篇-滑动验证码识别技术!

爬虫之识别验证码组件

Python 爬虫云验证码识别

验证码识别之Tesseract-OCR

python使用tesseract-ocr完成验证码识别

Python爬虫笔记【一】模拟用户访问之Tesseract-ocr验证码训练（5）

python3爬虫系列23之selenium+腾讯OCR识别验证码登录微博且抓取数据

asprise-ocr:验证码识别

java 验证码识别 ocr

爬虫验证码识别

爬虫验证码的识别

Python之验证码识别功能

【python】爬虫如何识别验证码之图形验证码（转灰度+二值化）

python爬虫之selenium+打码平台识别验证码

python 爬虫 pytesseract 验证码识别：识别拉勾网验证码

爬虫进阶之图形验证码识别技术

爬虫之验证码识别--古诗文网

Python爬虫模拟登录(六)：验证码识别一

python 爬虫 pytesseract 验证码识别：认识Tesseract

利用Python进行爬虫及识别验证码

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)