Google开源OCR识别Tesseract介绍 - 代码天地

Google开源OCR识别Tesseract介绍

其他 2020-08-04 18:10:53 阅读次数: 0

OCR是什么
OCR，即 Optical Character Recognition，光学字符识别，是指通过扫描字符，然后通过其形状将其翻译成电子文本的过程。通常技术中广泛流传的 OCR 指的就是“将图片转成文字”的智能技术。

Tesseract介绍
Tesseract是谷歌开发并开源的图像文字识别引擎，使用python开发。

Tesseract的安装
可以使用预编译(Pre-built)的二进制版本或者从源代码安装，在Ubuntu系统下运行

sudo add-apt-repository ppa:alex-p/tesseract-ocr
sudo apt-get update
sudo apt-get install tesseract-ocr
sudo apt-get install libtesseract-dev
sudo apt-get install tesseract-ocr-chi-sim

验证Tesseract是否正确安装，可以使用命令行来进行验证是否安装成功。

$ tesseract --version
Tesseract的使用
识别的基本用法是“imagename outputbase [options…]”，4.1的版本options只能通过“-l”选择语言。

比如对test.png进行OCR，然后把识别结果保存在test.txt里

tesseract test.png test -l chi_sim
更多的使用命令和方法，可以参照官方教程。

授权和地址
目前系统使用的是 pache License 2.0 开源协议，
官网介绍：访问 github 搜索 tesseract-ocr/tesseract

猜你喜欢

转载自blog.csdn.net/qq_26450889/article/details/107332030

Google开源OCR识别Tesseract介绍

OCR开源库Tesseract汉字识别训练

google开源OCR项目之tesseract-ocr

Tesseract Ocr文字识别

tesseract-ocr图片识别开源工具

图片文字识别开源工具Tesseract-ocr

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

Tesseract-OCR 识别中文

python + tesseract OCR 文字识别

Tesseract OCR与文本智能识别

[Unity]OCR识别--Tesseract篇

图片文字OCR识别-tesseract-ocr

Tesseract-OCR -01-Tesseract 介绍

【技术】Google开源OCR项目Tesseract安装版在Windows下的使用测试记录

Google开源OCR项目Tesseract安装版在Windows下的使用测试记录

开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

基于Eclipse下的 tesseract -OCR实现图片文字识别过程简单介绍

Mac 安装开源OCR tesseract和pytesseract

tesseract-ocr 开源引擎使用

JAVA OCR Tesseract 识别代码实现

使用Tesseract对图片文字OCR识别

光学识别（OCR）之 Tesseract

ubuntu安装tesseract 进行OCR识别

Tesseract-OCR-01-图片文字识别

Tesseract-OCR 中文识别（附上源码）

tesseract-ocr 使用java进行识别

识别图片tesseract-ocr的配置

tesseract_ocr+pytesseract图像识别

Tesseract-OCR-03-图片文字识别

基于Tesseract的OCR识别小程序

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)