Tesseract
OCR技术指的是将图片翻译成文字的光学文字识别技术。Tesseract是一个开源的OCR库,目前有谷歌赞助。Tesseract是目前公认最优秀、最准确的开源OCR库。
#########################################################################################################################################
(安装了1个多小时 环境变量配了命令行执行不了 佛了 现在卸载重装 睡觉睡觉) ########### 已解决
(不知道为什么命令行还是执行不了 显示‘tesseract’不是内部或外部指令,也不是可运行的程序或批处理文件)####### 重启电脑 环境变量就会更新 坑了我大半个晚上
#########################################################################################################################################
但是用pycharm能跑 测试代码:
from PIL import Image import pytesseract text = pytesseract.image_to_string(Image.open(r'C:\Users\Administrator\Desktop\image.png')) print(text)
运行结果:
Python3WebSpider
测试用图:
我佛啦
扫描二维码关注公众号,回复:
6785722 查看本文章