安装相关软件包:
$ pip3 install pillow ( pillow 是windows下的PIL库的精简版,使用方法同PIL一样)
$ pip3 install pytesseract
下载Tesseract-OCR 引擎windows安装版:
网址:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01dev-20170510.exe
安装位置可自定义,假设为:D:\install_hezhiqiang\Tesseract-OCR
设置环境变量:
在path中添加:
D:\install_hezhiqiang\Tesseract-OCR
系统环境变量中,添加变量“ TESSDATA_PREFIX ”,变量值为“D:\install_hezhiqiang\Tesseract-OCR\tessdata ”,如下图
初步使用:
$ import pytesseract
$ from PIL import Image
$ img = Image.open('./tvn0.jpg')
$ s = pytesseract.image_to_string(image)
$ print(s)