Tesseract_OCR技术在Java语言maven项目中使用Tess4j进行实现

在maven项目中,使用Java代码实现Tesseract_ocr技术非常的简单。只需要引入一个依赖就行。

<dependency>
  <groupId>net.sourceforge.tess4j</groupId>
  <artifactId>tess4j</artifactId>
  <version>4.3.1</version>
</dependency>

版本的选择,可以根据自己的需要自行去maven仓库中下载。下面咱们来看代码如何实现。

首先声明我是用idea写的代码。

代码就这么多。

public class Tesseract_ocr {
public static void main(String[] args){
// 图片和语言库的存放路径
String path = "E://com//dream//begin//Tesseract_OCR";
// 图片路径
File file = new File(path + "//image//jpg//bank//1_3.jpg");
System.out.println("本地文件路径:".concat(file.getPath()));
// 创建ITesseract对象
ITesseract instance = new Tesseract();
// 设置训练库的位置
instance.setDatapath(path + "//tessdata");
// 根据需求选择语言库 chi_sim :简体中文, eng
instance.setLanguage("chi_sim");
String result = null;
try {
// 识别开始获取时间戳
long startTime = System.currentTimeMillis();
// 图片识别
result = instance.doOCR(file);
// 识别结束时间戳
long endTime = System.currentTimeMillis();
System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
} catch (TesseractException e) {
e.printStackTrace();
}
// 识别信息
System.out.println("result: ".concat(result));
}
}

希望能帮助大家

限知识有限,如有问题,请纠正。

猜你喜欢

转载自www.cnblogs.com/zhizhixiaoxia/p/12015657.html