2019 7.9学习笔记

Tesseract

OCR技术指的是将图片翻译成文字的光学文字识别技术。Tesseract是一个开源的OCR库,目前有谷歌赞助。Tesseract是目前公认最优秀、最准确的开源OCR库。

#########################################################################################################################################

(安装了1个多小时 环境变量配了命令行执行不了 佛了 现在卸载重装 睡觉睡觉)                            ###########                                 已解决

(不知道为什么命令行还是执行不了 显示‘tesseract’不是内部或外部指令,也不是可运行的程序或批处理文件)#######             重启电脑     环境变量就会更新  坑了我大半个晚上

#########################################################################################################################################

但是用pycharm能跑 测试代码:

from PIL import Image
import pytesseract

text = pytesseract.image_to_string(Image.open(r'C:\Users\Administrator\Desktop\image.png'))
print(text)

运行结果:

Python3WebSpider

测试用图:

我佛啦

扫描二维码关注公众号,回复: 6785722 查看本文章

猜你喜欢

转载自www.cnblogs.com/jyjoker/p/11161509.html