【opencv 学习】使用tesseract-ocr机芯数字识别 - 代码天地

【opencv 学习】使用tesseract-ocr机芯数字识别

企业开发 2022-07-01 23:20:00 阅读次数: 0

今天学习 tesseract-ocr开源库的使用，这是个开源的能够识别多语言文字的库

下面是在Windows上安装的步骤
1：下载软件，选择最新的版本安装
https://github.com/UB-Mannheim/tesseract/wiki

The latest installers can be downloaded here:
tesseract-ocr-w32-setup-v5.0.1.20220118.exe (32 bit) and
tesseract-ocr-w64-setup-v5.0.1.20220118.exe (64 bit) resp.

2：安装时可以将语言包选上（比如不选择的话，默认的只能解析英文）

3：配置环境变量，将安装目录加载PATH环境变量中去，安装目录下面有个 tesseract.exe 。（选择的语言的训练包都在安装目录下的 tessdata 子目录）

4：检查下，打开cmd，
tesseract -v 查看版本
tesseract --list-langs 查看安装的语言

5：安装必要的库

pip install Pillow
pip3 install pytesseract

然后就可以写代码了

代码测试如下：

import cv2 as cv
from PIL import Image
import pytesseract as tess

src = cv.imread("images/number2.png")  # 读取图片
gray = cv.cvtColor(src, cv.COLOR_BGR2GRAY)
cv.imshow("src input image", gray)  # 通过名字将图像和窗口联系

ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
cv.imshow("binary", binary)

textInImage = Image.fromarray(binary)
text = tess.image_to_string(textInImage)
print("ocr detect result:%s" % text)

cv.waitKey(0)
cv.destroyAllWindows()

效果如下：
请添加图片描述
学习自：
https://www.cnblogs.com/zhigu/p/10646928.html
https://blog.csdn.net/ytzh88/article/details/106186475/
https://blog.csdn.net/qq_33731081/article/details/103812749

猜你喜欢

转载自blog.csdn.net/qq_29367075/article/details/123168691

【opencv 学习】使用tesseract-ocr机芯数字识别

OpenCV4基于Tesseract-OCR的OCR识别

使用 Tesseract 和 OpenCV 基于深度学习的 OCR 文本识别

OpenCV---数字验证码识别 Python验证码识别安装Pillow、tesseract-ocr与pytesseract模块的安装以及错误解决

OpenCV学习笔记11-Tesseract-OCR的安装和使用

Tesseract-ocr视觉学习-验证码识别及使用

tesseract-ocr 使用java进行识别

OCR(opencv vs tesseract)

文本的检测、识别实战：使用 Tesseract 进行 OpenCV OCR 和文本识别

Tesseract-OCR的使用

使用Tesseract+OpenCV+Python进行光学字符识别 (OCR)

图像识别学习记录——用tesseract-ocr程序识别图片中的数字

2019-03-18 OpenCV Tesseract-OCR 下载安装配置（cv2 报错）

基于OPENCV和tesseract的中文扫描票据OCR识别。

Python+OpenCV+Tesseract实现OCR字符识别

Tesseract-OCR 识别中文

Python opencv 机器学习 2.knn k近邻 ocr识别数字使用digits.png（opencv自带）

OpenCV-简单数字识别OCR

图片文字OCR识别-tesseract-ocr

linux下python使用tesseract-ocr进行图片识别

使用Tesseract-OCR训练文字识别记录

python使用tesseract-ocr完成验证码识别

使用tesseract-ocr实现图片文字识别 docker版

【OpenCV + Python】OCR识别

Opencv之OCR识别

opencv-ocr识别

Tesseract-OCR 的安装与使用

Tesseract-ocr 安装与使用

Tesseract-OCR 入门使用

tesseract-ocr的安装及使用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)