安装tesseract-ocr

下载tesseract-ocr网址:https://github.com/UB-Mannheim/tesseract/wiki

去上面这个网址可以找到如上图,有32位和64位还有以前版本,推荐4.0.0版本,下载完成之后,傻瓜式安装

找到中文语言识别包,添加上中文简体和常用数学公式和英语,然后点击下一步,记住你安装的路径,因为接下来要配置环境变量

配置环境变量:1、文件资源管理器中选中此电脑->右键属性打开界面->点击高级系统设置->在打开的系统属性界面点击环境变量->在环境变量界面选择系统变量中选中path,然后点下面的编辑,打开编辑环境变量界面新建一个C:\Program Files (x86)\Tesseract-OCR的值,然后确定

2、

在系统变量下面点击新建,按照如图建一个变量如图

变量名TESSDATA_PREFIX

变量值C:\Program Files (x86)\Tesseract-OCR\tessdata

,然后点击确定,之后界面依次点击确定,完成设置。变量建立完成。

然后打开cmd ,输入tesseract   ,出现如下图,则安装成功

然后要安装pytesseract,这个比较简单,直接pip install pytesseract

找到你安装的路径C:\Users\14197\AppData\Roaming\Python\Python36\site-packages,然后修改pytesseract\pytesseract.py里面的文件

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

修改为:你的tesseract.exe的安装路径

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe')

然后pycharm运行,大功告成!

猜你喜欢

转载自blog.csdn.net/qq_38900441/article/details/82823312