OCR学习笔记（3）tesseract学习

其他 2020-10-03 19:32:51 阅读次数: 0

OCR学习笔记（3）tesseract学习

tesseract介绍

Tesseract 是由惠普发布后谷歌维护的开源文字识别项目，从 Tesseract v4 开始宣布支持深度神经网络 LSTM 进行文字识别。

win10下tessercat安装

(0)我的python版本为3.6.5
(1)下载地址：https://digi.bib.uni-mannheim.de/tesseract/
我选择的版本是：在这里插入图片描述
这里的版本需要与之后安装的tessorocr或pytesseract对应。
安装时不要勾选downloda内容，因为没有梯子下载会很慢或者失败。
(2)可以在GitHub上下载语言包：https://github.com/tesseract-ocr/tessdata
我选择的是中文语言包
在这里插入图片描述
之后将下载好的文件拷贝到Tesseract-OCR目录下的的tessdata文件夹中，并将tessdate文件夹复制一份到python安装目录下。
(3)添加环境变量
此处参考博客，博主解释的非常清楚环境变量参考博客

pytesseract或tesserocr安装

（1）teseerocr包，安装过程为：
在github上下载tesserocr-2.2.2-cp36-cp36m-win_amd64.whl 之后利用cmd进行安装。
代码：

import tesserocr
from PIL import Image
image = Image.open(r'F:\download\blueman00-text-detection-ctpn-master\text-detection-ctpn\ctpn\data\demo\010.png')
image_vert=tesserocr.image_to_text(image)
print(image_vert)

输入为：在这里插入图片描述
输出为：

（2）pytesseract安装
我直接在pycharm内安装

代码：

import pytesseract
from PIL import Image
image = Image.open(r'F:\download\blueman00-text-detection-ctpn-master\text-detection-ctpn\ctpn\data\demo\010.png')
image_vert=pytesseract.image_to_string(image)
print(image_vert)

猜你喜欢

转载自blog.csdn.net/dbdxwyl/article/details/108330700

OCR学习笔记（3）tesseract学习

OpenCV学习笔记11-Tesseract-OCR的安装和使用

Python学习笔记--Python 爬虫入门 -17-11 tesseract-OCR

【OCR】OCR学习记录(3)

Tesseract-ocr视觉学习-验证码识别及使用

【opencv 学习】使用tesseract-ocr机芯数字识别

使用 Tesseract 和 OpenCV 基于深度学习的 OCR 文本识别

OCR的学习笔记

吴裕雄--天生自然python学习笔记：python安装配置tesseract-ocr-setup-3.05.00dev.exe

tesseract-ocr的字库学习步骤(训练自己的文库)，关于ocr的对图片的解析,包括tesseract的安装（史上最全）

Tesseract OCR

学习图像处理知识---Emgu3.4 OCR类库学习--Tesseract 类

图像识别学习记录——用tesseract-ocr程序识别图片中的数字

OCR学习

『OCR深度实践』OCR学习笔记(1)：绪论

『OCR深度实践』OCR学习笔记(2)：图像预处理

学习笔记-图像识别(Photo OCR)

caffe_ocr开源项目学习笔记

Halcon学习笔记（三）——OCR识别

Python学习笔记——爬虫的执行JavaScript语句与训练Tesseract

OCR----Tesseract 3.x架构及原理解析

[笔记]Win10下编译Tesseract-OCR 4.0

【OCR】OCR学习记录(4)

【OCR】OCR学习记录(2)

【OCR】OCR学习记录(1)

OCR(opencv vs tesseract)

Tesseract-OCR的使用

初识tesseract-ocr

Tesseract OCR iOS 教程

Tesseract-OCR 入门

今日推荐

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

android 文件上传（模拟表单提交）

node中遇到的一些问题

zhuanzai

树莓派3B板载蓝牙与HC05蓝牙模块配对(shell命令实现)

configparser模块简介 configparser模块简介

度度熊的01世界

浅谈log4j-6-xml配置转自godtrue

Kali无线渗透获取宿舍WiFi密码（WPA）

在VMware虚拟机中安装ubuntu

如何用微信公众号二维码事件做扫码登陆

每日归档

更多

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)