最近在做ocr文字识别,记录下安装tesseract训练工具过程

最近在做ocr文字识别,记录下安装tesseract训练工具过程

调用tesseract的API无需安装(也可以安装exe,设置环境变量),只需在vs中配置好(类似于opencv一样)

而别人或官方训练好的模型在自己的项目上效果不佳时,需要训练模型。这里记录下训练需要安装的三个工具。

  1. tesseract:有博主建议不要下载带dev,alpha,beta等,不稳定,可能是测试版本。这里大家注意下。我安装的是:tesseract-ocr-setup-4.0.0dev-20161129.exe
  2. java的JDK:需要安装java环境,我安装的是这个,jdk-8u311-windows-x64.exe。
  3. jTessBoxEditor:这个下载后不需要安装的,JDK安装没错的话可以直接启动,用这个来进行训练。

注意:安装Java JDK时,安装过程中会出现两次 安装提示 。第一次是安装 jdk ,第二次是安装 jre 。建议两个都安装在同一个java文件夹中的不同文件夹中。(不能都安装在java文件夹的根目录下,jdk和jre安装在同一文件夹会出错)(来自百度文库:https://jingyan.baidu.com/article/6dad5075d1dc40a123e36ea3.html)
并且,配置系统变量时需要配置两个:
1:新建名为:JAVA_HOME变量 ,变量值为jdk的安装目录(例如: D\Java\jdk1.8.0)
2:在Path输入 ;%JAVA_HOME%\bin
(注意前面有;不要忘了)

猜你喜欢

转载自blog.csdn.net/qq_43207709/article/details/121561859