Tesseract-OCR 入门

其他 2018-07-19 20:03:26 阅读次数: 0

Tesseract-OCR是一个文本识别的开源项目。本人使用下来。感觉英文识别很高。中文识别不是很高。需要进行中文训练。识别率会有所提升

使用环境 mac os 10.11.6

1、首先安装 tesseract（已经安装，跳过此步骤）

brew install --with-training-tools tesseract

2、下载chi_sim中文简体语言库
Tesseract-OCR默认是识别英文的。如果需要识别中文需要。需要网上下载一个中文语言库chi_sim.traineddata

3、识别文本图片

网上随便截取一张图片保存到本地jpg格式。进入目录执行

tesseract new.jpg -l chi_sim new

会在当前目录生成一个new.text文件。那么此文件就是图片识别出来的文本内容。其中有些文字会识别不出来。则需要进行中文训练

如图:

文本识别效果

猜你喜欢

转载自blog.csdn.net/geeksnow/article/details/78465862

Tesseract-OCR 入门

Tesseract-OCR引擎入门

Tesseract-OCR 入门使用

Tesseract-OCR从入门到精通之windows环境实现图片文字识别

Python学习笔记--Python 爬虫入门 -17-11 tesseract-OCR

Mac下Tesseract-OCR文字识别新手使用入门

Tesseract-OCR入门使用（3）-VS2010编译源码

Tesseract-OCR入门使用（1）-安装包获取和命令行调用

初识tesseract-ocr

Tesseract-OCR的使用

安装tesseract-ocr

tesseract-ocr训练

tesseract-ocr

Tesseract-OCR安装

python Tesseract-OCR

[tesseract-ocr]

Tesseract-OCR 4.1

Tesseract-OCR的安装

tesseract ocr 入门

Solr: Install tesseract-ocr

Tesseract-OCR 识别中文

linux 安装Tesseract-OCR

macbook 安装tesseract－ocr

Tesseract-OCR 的安装与使用

Tesseract-ocr 安装与使用

Tesseract-OCR 字库训练

tesseract-ocr的安装及使用

Tesseract-OCR试水

Tesseract-OCR引擎的安装

Tesseract-OCR -01-Tesseract 介绍

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)