下载地址:https://github.com/tesseract-ocr/tesseract/wiki
1、介绍
图片文字的OCR识别有一款开源原件tesseract-ocr,最初是在linux上,当然现在也有windows版本,现在发展到4.0版本。
2、下载tesseract-ocr
下载地址:https://github.com/tesseract-ocr/tesseract/wiki
里面有linux版本、macOS版本还有windows版本
下面下载windows版本,如下图:
点击上面的链接,进入
下载完成
3、安装,设置环境变量
双击上的exe,进行安装
安装目录C:\Program Files (x86)\Tesseract-OCR,安装完成后,设置环境变量
在系统变量下面点击新建,按照如图建一个变量如图
变量名TESSDATA_PREFIX,变量值:C:\Program Files (x86)\Tesseract-OCR\tessdata
4、应用
经过上面的调整tesseract命令可以在任意目录调用了,下面是tessract应用实例
识别中文图片