Opencv+python 实战一：实现字符识别（附资料下载链接及代码） - 代码天地

Opencv+python 实战一：实现字符识别（附资料下载链接及代码）

其他 2021-11-20 07:09:57 阅读次数: 0

素材来源：https://www.youtube.com/watch?v=0IqCOPlGBTs
运行环境：win10+vscode+python3.7.+opencv4.4.0

准备工作

1、下载tessdoc

网站：https://tesseract-ocr.github.io/tessdoc/
无法科学上网的朋友可以上百度云：
链接：https://pan.baidu.com/s/1fjvFBJDEicLrMtmlwOtrUg
提取码：9qe5

安装完后找到这个文件，记录一下路径：
在这里插入图片描述

2、安装pillow以及pytesseract库

pip install pillow
pip install pytesseract

3、准备一张字符图片

在这里插入图片描述

代码

import cv2
import pytesseract           # pip install pytesseract
import numpy as np 
from PIL import ImageGrab    # pip install pillow 
import time

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'   
#需要下载tessdoc找到该文件并保存路径，这个要换成自己的
img = cv2.imread('C:\\Users\\Administrator\\Desktop\\TextDetection\\1.png')                       #需要图片的绝对路径
img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)                                                         #以RGB形式读取图片
################字符识别标记#####################
hImg, wImg,_ = img.shape
boxes = pytesseract.image_to_boxes(img)
for b in boxes.splitlines():
    print(b)
    b = b.split(' ')
    print(b)
    x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(img, (x,hImg- y), (w,hImg- h), (50, 50, 255), 2)
    cv2.putText(img,b[0],(x,hImg- y+25),cv2.FONT_HERSHEY_SIMPLEX,1,(50,50,255),2)
################################################
cv2.imshow('img', img)
cv2.waitKey(0)

运行结果如下：

在这里插入图片描述

其他相关实例：图片转字符、检测单词、只检测数字、网络摄像头和屏幕截图示例

import cv2
import pytesseract
import numpy as np
from PIL import ImageGrab
import time


pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
img = cv2.imread('1.png')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
pytesseract
##############################################
##### 图片转字符   ######
##############################################
# print(pytesseract.image_to_string(img))

#############################################
#### 检测字符  ######
#############################################
hImg, wImg,_ = img.shape
boxes = pytesseract.image_to_boxes(img)
for b in boxes.splitlines():
    print(b)
    b = b.split(' ')
    print(b)
    x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(img, (x,hImg- y), (w,hImg- h), (50, 50, 255), 2)
    cv2.putText(img,b[0],(x,hImg- y+25),cv2.FONT_HERSHEY_SIMPLEX,1,(50,50,255),2)


##############################################
##### 检测单词  ######
##############################################
# #[   0          1           2           3           4          5         6       7       8        9        10       11 ]
# #['level', 'page_num', 'block_num', 'par_num', 'line_num', 'word_num', 'left', 'top', 'width', 'height', 'conf', 'text']
# boxes = pytesseract.image_to_data(img)
# for a,b in enumerate(boxes.splitlines()):
#         print(b)
#         if a!=0:
#             b = b.split()
#             if len(b)==12:
#                 x,y,w,h = int(b[6]),int(b[7]),int(b[8]),int(b[9])
#                 cv2.putText(img,b[11],(x,y-5),cv2.FONT_HERSHEY_SIMPLEX,1,(50,50,255),2)
#                 cv2.rectangle(img, (x,y), (x+w, y+h), (50, 50, 255), 2)


##############################################
##### 只检测数字  ######
##############################################
# hImg, wImg,_ = img.shape
# conf = r'--oem 3 --psm 6 outputbase digits'
# boxes = pytesseract.image_to_boxes(img,config=conf)
# for b in boxes.splitlines():
#     print(b)
#     b = b.split(' ')
#     print(b)
#     x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
#     cv2.rectangle(img, (x,hImg- y), (w,hImg- h), (50, 50, 255), 2)
#     cv2.putText(img,b[0],(x,hImg- y+25),cv2.FONT_HERSHEY_SIMPLEX,1,(50,50,255),2)


##############################################
##### 网络摄像头和屏幕截图示例 ######
##############################################
# cap = cv2.VideoCapture(0)
# cap.set(3,640)
# cap.set(4,480)
# def captureScreen(bbox=(300,300,1500,1000)):
#     capScr = np.array(ImageGrab.grab(bbox))
#     capScr = cv2.cvtColor(capScr, cv2.COLOR_RGB2BGR)
#     return capScr
# while True:
#     timer = cv2.getTickCount()
#     _,img = cap.read()
#     #img = captureScreen()
#     #DETECTING CHARACTERES
#     hImg, wImg,_ = img.shape
#     boxes = pytesseract.image_to_boxes(img)
#     for b in boxes.splitlines():
#         #print(b)
#         b = b.split(' ')
#         #print(b)
#         x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
#         cv2.rectangle(img, (x,hImg- y), (w,hImg- h), (50, 50, 255), 2)
#         cv2.putText(img,b[0],(x,hImg- y+25),cv2.FONT_HERSHEY_SIMPLEX,1,(50,50,255),2)
#     fps = cv2.getTickFrequency() / (cv2.getTickCount() - timer);
#     #cv2.putText(img, str(int(fps)), (75, 40), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (20,230,20), 2);
#     cv2.imshow("Result",img)
#     cv2.waitKey(1)
#
#

cv2.imshow('img', img)
cv2.waitKey(0)

猜你喜欢

转载自blog.csdn.net/qq_36535414/article/details/108671614

Opencv+python 实战一：实现字符识别（附资料下载链接及代码）

opencv+python（一）

【opencv+python】下载安装教程

openCV+python实现图像去雾

OpenCV+Python实现目标检测

OpenCV+python：直方图的应用（一）

【转载】OpenCV+Python引言篇（一）

OpenCV+Python识别车牌和字符分割的实现

openCV+Python实战练习——银行卡号识别

opencv+python机读卡识别整合版

OpenCV+Python 文字识别（重点图像透视变换）

使用OpenCV+Python进行人脸识别

opencv+python实现视频实时质心读取

Opencv+Python实现图像运动模糊和高斯模糊

OpenCV+python实现实时目标检测并保存视频

OpenCV+Python实现视频文件裁剪功能

opencv+python入门学习之一图像的基本操作

opencv+python提取图片中某一颜色的物体

零基础用一百行代码完成动态的人脸识别（opencv+python）

利用Opencv+Python 实现二维码识别

人工智能-OpenCV+Python实现人脸识别（视频人脸检测）

OpenCV+Python 人脸识别 | Haar级联（检测）& Eigenfaces算法（识别）

利用openCV+python进行HSV颜色识别，并结合滑动条动态改变目标颜色

Opencv+Python实现图像运动模糊和高斯模糊的示例

openCV+python 采用滑动条实现动态全局阈值分割

openCV+python 采用滑动条实现动态全局阈值分割

使用opencv+python实现最简单摄像头实时人脸识别（附源码，适合入门）

opencv+python

opencv+python (3)

opencv+python (2)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)