使用pytesseract识别图片的环境搭建 - 代码天地

使用pytesseract识别图片的环境搭建

其他 2019-04-02 14:21:12 阅读次数: 0

最近在测试一个视频系统，由于播放器是第三方插件，为监测系统不稳定各种情况的具体百分比，故从UI层进行截图，并对图片进行识别。下面描述一下欲使用pytesseract进行的环境搭建过程（我使用的anaconda进行管理库的，库文件需要安装在anaconda/scripts下）。

准备：tesseract-ocr和中文语言包chi_sim.traineddata

1.安装pytesseract
安装pytesseract库
2.安装pillow
pillow为Python的第三方图像处理库，可以对图像进行存储、显示、格式转化等相关处理。PIL和pillow是同样作用的库，两者只能安装一个。
安装方法同上，命令为pip install pillow
3.安装识别引擎tesseract-ocr
tesseract是开源的OCX(光学字符识别-对图片文件中的文字进行分析识别、获取的过程)识别引擎。
运行下载的安装程序tesseract-ocr-setup-4.00.00dev.exe
安装的识别引擎
安装后如图所示：
安装以后
4.中文语言包放入tessdata目录
由于tesseract-ocr默认是不支持中文识别的，需将提前下载好的中文语言包放入识别引擎的文件tessdata文件目录下方才可识别，如下图所示：

5.修改配置，关联tesseract-ocr
打开pytesseract.py文件进行如下修改：
配置文件的位置
修改的内容
6.验证
识别的图片：

编写如下程序并运行
运行结果：
在这里插入图片描述
注意：图片位置

猜你喜欢

转载自blog.csdn.net/qq_44801116/article/details/88698232

使用pytesseract识别图片的环境搭建

python 使用pytesseract图片识别

python使用pytesseract识别图片中的文字

python 使用pytesseract图片文字识别

Python3使用 pytesseract 进行图片识别

图片文字识别-pytesseract模块

python-OCR图片识别库--pytesseract

pytesseract模块验证码图片识别

pytesseract提取识别图片中的文字

使用python内置库pytesseract实现图片验证码的识别

python-使用内置库pytesseract实现图片验证码的识别

2-14 使用pytesseract识别图片中得问题.py

python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别的方法

【pytesseract 识别】

使用pytesseract进行图像识别

centos 下使用 pytesseract 识别文字

使用pytesseract识别简单验证码

通过Python的pytesseract库识别图片中的文字

【Python • 图片识别】pytesseract快速识别提取图片中的文字

python -使用pytesseract识别验证码中遇到的问题

使用pytesseract图像处理之中文识别（二）

python -使用pytesseract识别文字时遇到的问题

Python使用pytesseract进行验证码图像识别

pycharm使用案例——利用pytesseract进行图形识别的利用

pytesseract文字识别

pytesseract图像文字识别

pytesseract：中文识别模块

pytesseract识别数字

pytesseract在识别只有一个数字的图片时识别不出来

pytesseract图片转文字

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)