有幸接触到tesseract4.0,配置环境弄了很久,在此分享给大家
首先在此链接下载好所需要的配置
解压后是三个文件夹
打开vs2015 新建项目 win32控制台程序
点击完成
找到类视图 ,
右键属性
配置属性->vc++目录 找到包含目录 ,把之前解压文件里的d:...\include ,d:...\include\tesseract ,d:...\include\leptonica 三个路径添加进去,找到库目录,将解压文件里的D:..\lib\x64\debug的路径添加进去
链接器->输入->附加依赖项,把D:..\lib\x64\debug里所有.lib的名字添加进去,如图
进入D:...\dll\x64\debug,将所有的.dll文件复制到刚创建的vs工程下
然后配置环境,下载eng.traineddata文件,这是英文的训练文件,大家按照自己的需要下载需要的文件
下载地址是https://github.com/tesseract-ocr/tessdata
右键我的电脑->属性->高级系统设置->环境变量,新建
变量名为 TESSDATA_PREFIX ,变量值为traineddata所在路径 ,点击确定
接下来测试是否配置成功
右键 源文件 ->添加->新建项目 创建main.cpp
将如下内容复制
#include <stdio.h> #include <allheaders.h> #include <capi.h> void die(const char *errstr) { fputs(errstr, stderr); exit(1); } int main(int argc, char *argv[]) { TessBaseAPI *handle; PIX *img; char *text; //原图像的绝对路径 if ((img = pixRead("D:\\aa.png")) == NULL) die("Error reading image\n"); handle = TessBaseAPICreate(); if (TessBaseAPIInit3(handle, NULL, "eng") != 0) die("Error initialising tesseract\n"); TessBaseAPISetImage2(handle, img); if (TessBaseAPIRecognize(handle, NULL) != 0) die("Error in Tesseract recognition\n"); if ((text = TessBaseAPIGetUTF8Text(handle)) == NULL) die("Error getting text\n"); fputs(text, stdout); //输出OCR识别的文本信息 system("pause"); TessDeleteText(text); TessBaseAPIEnd(handle); TessBaseAPIDelete(handle); pixDestroy(&img); return 0; }
开始执行
大公告成