图片文字OCR识别-tesseract-ocr

  下载地址:https://github.com/tesseract-ocr/tesseract/wiki

  1、介绍

    图片文字的OCR识别有一款开源原件tesseract-ocr,最初是在linux上,当然现在也有windows版本,现在发展到4.0版本。

  2、下载tesseract-ocr

    下载地址:https://github.com/tesseract-ocr/tesseract/wiki

    里面有linux版本、macOS版本还有windows版本

    下面下载windows版本,如下图:

    

    点击上面的链接,进入

    

    下载完成

    

  3、安装,设置环境变量

    双击上的exe,进行安装

    安装目录C:\Program Files (x86)\Tesseract-OCR,安装完成后,设置环境变量

    

    在系统变量下面点击新建,按照如图建一个变量如图

    变量名TESSDATA_PREFIX,变量值:C:\Program Files (x86)\Tesseract-OCR\tessdata

    

  4、应用

    经过上面的调整tesseract命令可以在任意目录调用了,下面是tessract应用实例

    识别中文图片

 

猜你喜欢

转载自www.cnblogs.com/shaosks/p/9376575.html