Tesseract-OCR 训练教程（二）合并新的训练文件

其他 2018-06-22 16:18:41 阅读次数: 3

在原有训练数据的基础上，如果有新的字符训练信息需要加入，所有数据重新校准一遍就累死人了。。。。

经研究找到实用合并方法（红色部分为示例，实际应为你自己生成的文件名）：

在新的训练数据生成.box 和.tr文件后，

生成字符集 unicharset_extractor add.font.exp0.box new.font.exp0.box

合并训练数据(.tr)

mftraining -F font_properties -U unicharset -O added.unicharset add.font.exp0.tr new.font.exp0.tr

聚合所有的tr文件：

cntraining add.font.exp0.tr new.font.exp0.tr

重命名文件，我把unicharset, inttemp, normproto, pfftable ，shapetable这几个文件加了前缀added.（注：added.只是我给合成的字典的命名，个人随意）

合并所有文件，生成一个大的资库文件。

命令：combine_tessdata added.

扫描二维码关注公众号，回复： 1701623 查看本文章

猜你喜欢

转载自www.cnblogs.com/password1/p/9213908.html

Tesseract-OCR 训练教程（二）合并新的训练文件

tesseract-ocr训练

Tesseract-OCR 字库训练

使用jTessBoxEditorFX训练Tesseract-OCR教程

Tesseract-OCR 训练教程（一）

Tesseract-OCR的简单使用与训练

[Tesseract-OCR]训练字库

tesseract-ocr训练数据步骤

Tesseract-OCR LSTM二次训练遇到的坑

Tesseract-OCR识别中文与训练字库实例

Tesseract-OCR识别中文与训练字库

使用Tesseract-OCR训练文字识别记录

Tesseract-OCR识别中文与训练字库实例（转）

使用 tesseract-ocr生成训练库全部指令

Tesseract-OCR 简单的中文数字混合训练

Tesseract-OCR 字符识别---样本训练

###好#####Tesseract-OCR识别中文与训练字库实例

Ubuntu编译/安装/训练/运行tesseract-ocr

Tesseract-OCR样本训练方法详细

tesseract-ocr的字库学习步骤(训练自己的文库)，关于ocr的对图片的解析,包括tesseract的安装（史上最全）

tesseract-ocr 合并box文件的方法

tesseract-ocr字符识别，安装/测试/训练问题/解决方案

JAVA验证码识别：基于jTessBoxEditorFX和Tesseract-OCR训练样本

Tesseract-OCR识别中文与训练字库的使用方法

Tesseract-OCR识别中文之---训练自定义字库生成语言包

Python爬虫笔记【一】模拟用户访问之Tesseract-ocr验证码训练（5）

ocr tesseract 3.4训练记录

tesseract_ocr训练字库、合并字库

OCR开源库Tesseract汉字识别训练

Tesseract-OCR批量标注及合并数据集的一种思路

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

Tesseract-OCR 训练教程（二） 合并新的训练文件

猜你喜欢

Tesseract-OCR 训练教程（二）合并新的训练文件