pytesseract图像文字识别

利用python的包进行图像文字识别:

pytesseract的安装教程:https://blog.csdn.net/qq_36535820/article/details/103426054

导入pytesseract包

>>> import pytesseract
>>> from PIL import Image

图像文字识别结果:

待识别图像:

图像11:

图像文字识别代码及结果: 

>>> im11 = Image.open(r'E:\\公司文件\\11.png')
>>> print(pytesseract.image_to_string(im11))
> What a me day :1 Is
> Its a Lovely Day Today
> Today's weather
> Today Is nne

图像12:

图像文字识别代码及结果: 

>>> im12 = Image.open(r'E:\\公司文件\\12.png')
>>> print(pytesseract.image_to_string(im12))
ABCDEFG
HI JKLMN
OPQRSTU
VWXYZ

图像13:

>>> im13 = Image.open(r'E:\\公司文件\\13.png')
>>> print(pytesseract.image_to_string(im13))

图像14:

图像文字识别代码及结果: 

>>> im14 = Image.open(r'E:\\公司文件\\14.png')
>>> print(pytesseract.image_to_string(im14))
JA,.,.,..»./wmwaxwu,
mu zémééaa/f.u~ru».4:t xx. wdganu/ruh. ,»6wK«
Iwyaé wifl m uni.»//nag»/-2‘: den}

/7 Mr’? he/-yd/¢. .,., 4... /M 1.1-/./Viym
vnu .4! W rrnww-ma, 4»; Am.» flu. flan.
tm._JA A A,/. 9/Am/yflé. jM4n’¢r1fAll:
arfvazH:fiu»«¢d/m mud,  My/56¢
u-./ aw¢Auy.yyuam.mAfm,.., wy vngzmi
mm/aimzzsflum .4u(../.»«m,...;H: '
Ia-1;‘ mg; on. .2 aé:mz.Z7mm¢<,/w ea-rm". -1:43./:5-r
war m a mg, 41., «M».

50-‘ 47.57/24. J3.»»..§_{:m.‘i'/1 2.»;

: uyx  %Vdz fl ..d.m, yfmm
vmwfi'H4£u.fM22w/ K/F07.‘Dtu Am 4,,,,g“,_
/I/71$]! Aim] 3*./11 {A44 /....4 Mia rs /u¥ m,

DWI‘-W012-gfil mm;

 图像15:

图像文字识别代码及结果:

>>> im15 = Image.open(r'E:\\公司文件\\15.png')
>>> print(pytesseract.image_to_string(im15))
try V"J’L\/J ')v\ H

H4y/ o

1 eight
2 nine
» 3 ten
’ I . eleven
7 twelve
I ; thirteen

'  fourteen





10
11
12
13
14

8

fifteen
sixteen
seventeen
eighteen
nineteen
twsnw

M twenty-(Mme

T,
15 ts

16 t]
17 f<
18 f

7195

205
216

       折腾了好久,仍然只是在cmd上面测试成功,且图像文字识别效果不是很好。针对书写的清晰英文识别率较高,对不清晰、潦草或位置摆放不恰当的图片英文文字内容识别率差差。还没测试图像中文识别效果,估计也不会太好。

       当然这些图片未经过任何处理,在经过一定处理后的图片,图像识别率会提升,但提升多少还未有测试。我看博客有个博主推荐了一片大神写的代码实现图像处理,提高pytesseract图像文字识别率,大家可以去看看(我没实践过,不知道代码实际效果了)。


 

发布了147 篇原创文章 · 获赞 24 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/qq_36535820/article/details/103469198
今日推荐