使用python的opencv和tesseract库来识别图片中指定区域的中文

其他 2021-01-25 10:25:52 阅读次数: 0

使用python的opencv和tesseract库来识别图片中指定区域的中文

需求说明

图片中包含大量中文，tesseract全图识别是逐行识别的，无法得出满意的结果，需要识别指定区域的中文。

实现方案

我们可以使用指定ROI（region of interest）的方式，对ROI里的中文进行识别。Python的opencv库和tesseract库安装和使用都非常方便，文档也比较全，因此选择使用python的opencv和tesseract库来进行识别。

参考文档：
https://docs.opencv.org/3.0-beta/doc/py_tutorials/py_core/py_basic_ops/py_basic_ops.html#image-roi
https://pypi.org/project/pytesseract/

示例代码

# coding: utf-8
import cv2
import pytesseract

# 设置tesseract可执行程序及中文字库的路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'
tessdata_dir_config = r'--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\tessdata"'

img = cv2.imread("E:\\workspace\\cvimg\\1.png")

print img.shape
height, width, _ = img.shape

# 设定图片区域，例如取图片顶部以下60行、从右往左数第5-125列的区域
img_roi = img[0:60, width-125:width-5]

text = pytesseract.image_to_string(img_roi, lang='chi_sim', config=tessdata_dir_config)
print text

# 由于图片上字符间距的原因，识别出的文本中可能会包含空格，使用下列语句去除空格
for r in text.splitlines():
    print r.replace(" ", "")

cv2.namedWindow("roi")
cv2.imshow("roi", img_roi)
cv2.waitKey(0)
cv2.destroyAllWindow()

猜你喜欢

转载自blog.csdn.net/huzhenwei/article/details/83508524

使用python的opencv和tesseract库来识别图片中指定区域的中文

Python Opencv实践 - 入门使用Tesseract识别图片中的文字

tesseract识别图片中文字

python 包的使用（二）——tesseract识别图片中的文字

【python人脸识别】使用opencv识别图片中的人脸

Java调用 Tesseract 实现图片中文字识别

tesseract识别图片中的中文最新最稳教程

用python去除图片中指定颜色的像素

Opencv<python版本在图片中插入中文>

图片文字识别：Tesseract OCR库在Python中基本使用

python使用opencv实现识别指定区域的行人

python使用pytesseract识别图片中的文字

vue中使用tesseract实现OCR/文字识别(识别图片中的文字)

python 使用tesseract进行图片识别

python tesseract图片识别

python实战===用python识别图片中的中文

深度学习——使用Tesseract.js在浏览器离线识别图片中的文字

python-opencv-人脸识别实现从图片中扣人脸

基于OPENCV和tesseract的中文扫描票据OCR识别。

如何识别图片中的表格数据（opencv 和pyteressact）

android 端拍照并运用Tesseract OCR 识别图片中字符

python使用开源图片识别第三方库tesseract

python识别图片中的代码。

python 识别图片中的汉字

Python识别图片中的文字

通过Python的pytesseract库识别图片中的文字

python opencv图片二值化后取出图片中心区域的轮廓

opencv在图片中擦除指定的类别

基于Tesseract模块Python实现提取图片中的文字信息（安装+使用教程）

图片识别工具Tesseract与使用

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)