tesseract运行代码过程中出现的问题

1.pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your path

解决办法:

方法1[推荐]: 将tesseract.exe添加到环境变量PATH中,

例如: D:\Tesseract-OCR,默认路径为C:\Program Files (x86)\Tesseract-OCR

注意: 为了使环境变量生效,需要关闭cmd窗口或是关闭pycharm等ide重新启动

方法2: 修改pytesseract.py文件,指定tesseract.exe安装路径

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe‘

方法3: 在实际运行代码中指定

添加如下代码;将tesseract.exe路径添加到代码中

pytesseract.pytesseract.tesseract_cmd = 'D:\\nn\Tesseract-OCR\\tesseract.exe'

以上三种方法都尝试了,最后发现第三种方法奏效!

附上测试代码:

try:
    import Image
except ImportError:
    from PIL import Image
    import pytesseract

    pytesseract.pytesseract.tesseract_cmd = 'D:\\Tesseract-OCR\\tesseract.exe'
    print('识别出的结果如下:')
    print(pytesseract.image_to_string(Image.open('18.png')))

    # print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))
2.pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file \nn\Tesseract-OCR\eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory. Failed loading language ‘eng’ Tesseract couldn’t load any languages! Could not initialize tesseract.’)

解决办法:

添加如下代码;将tesseract.exe路径添加到代码中

os.environ['TESSDATA_PREFIX'] = 'D:\\nn\Tesseract-OCR\\tessdata'
3.Failed loading language ‘eng’ Tesseract couldn’t load any languages! Could not initialize tesseract.

解决办法:

重新安装tesseract,我的电脑安装的3.6,安装4.0后,又出现以上2的问题,然后按照2的解决办法解决后,代码就可以成功运行!

http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

猜你喜欢

转载自blog.csdn.net/u014229742/article/details/85319895