java使用开源类库Tesseract实现图片识别 - 代码天地

java使用开源类库Tesseract实现图片识别

其他 2019-09-08 22:04:35 阅读次数: 0

Tesseract-OCR支持中文识别，并且开源和提供全套的训练工具，是快速低成本开发的首选。

Tess4J则是Tesseract在Java PC上的应用

Tesseract的OCR引擎最先由HP实验室于1985年开始研发，至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而，HP不久便决定放弃OCR业务，Tesseract也从此尘封。

数年以后，HP意识到，与其将Tesseract束之高阁，不如贡献给开源软件业，让其重焕新生－－2005年，Tesseract由美国内华达州信息技术研究所获得，并求诸于Google对Tesseract进行改进、消除Bug、优化工作。

Tesseract目前已作为开源项目发布在Google Project，其项目主页在这里查看。

   <!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
        <dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>3.4.0</version>
        </dependency>

实现代码开发：

  File imageFile = new File("input dir/shuzi.png");
        Tesseract tessreact = new Tesseract();
        //需要指定训练集 训练集到 https://github.com/tesseract-ocr/tessdata 下载。
        tessreact.setDatapath("E:\\itcast\\env\\tess4j\\tessdata");
        //注意  默认是英文识别，如果做中文识别，需要单独设置。
        tessreact.setLanguage("chi_sim");
        try {
            String result = tessreact.doOCR(imageFile);
            System.out.println(result);
        } catch (TesseractException e) {
            System.err.println(e.getMessage());
        }

猜你喜欢

转载自www.cnblogs.com/alexzhang92/p/11488679.html

java使用开源类库Tesseract实现图片识别

python使用开源图片识别第三方库tesseract

图片识别工具Tesseract与使用

图片文字识别：Tesseract OCR库在Python中基本使用

Java调用 Tesseract 实现图片中文字识别

tesseract-ocr+java实现图片文字识别

使用tesseract-ocr实现图片文字识别 docker版

tesseract ocr(图像识别类库) 使用

OCR开源库Tesseract汉字识别训练

tesseract图片识别库的简单操作

开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

java图片文字识别tesseract-ocr

使用Tesseract对图片文字OCR识别

python 使用tesseract进行图片识别

vue中使用tesseract实现OCR/文字识别(识别图片中的文字)

tesseract-ocr图片识别开源工具

图片文字识别开源工具Tesseract-ocr

使用python的opencv和tesseract库来识别图片中指定区域的中文

tesseract 图片识别文字

python tesseract图片识别

JAVA OCR Tesseract 识别代码实现

java语言下利用tess4j开源库实现图片识别功能

tesseract-ocr 使用java进行识别

Java中使用tess4J（Tesseract-OCR）进行图片文字识别（支持中文）

Java中使用tess4J（Tesseract-OCR）进行图片文字识别

使用tesseract识别采集到内存中的图片+解决tesseract不识别最左侧字符的问题

linux下python使用tesseract-ocr进行图片识别

python 包的使用（二）——tesseract识别图片中的文字

使用tesseract识别图片（主要用于验证码）

如何使用tesseract-ocr4.0识别图片文字

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)