Python 用 Tesseract识别图片提取文本 - 代码天地

Python 用 Tesseract识别图片提取文本

其他 2020-02-13 16:21:30 阅读次数: 0

环境: win10，python3.7，vs code；

首先下载tesseract

https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.0.0-alpha.20170804.exe

我装在了F盘在路径下敲命令

tesseract –v 可以看版本号

tesseract --list-langs　　查看Tesseract-OCR支持语言

下好后需要改文件

找到python路径下 Lib\site-packages\pytesseract\pytesseract.py

将#tesseract_cmd = 'tesseract'
改为：tesseract_cmd = 'F:/Tesseract-OCR/tesseract.exe'(目录根据自己tesseract的安装路径而定)

在系统变量path中追加 F:\Tesseract-OCR\tessdata

新建变量 TESSDATA_PREFIX

接下来就可以在python代码中尝试了

图片为：

结果：

感觉效果一般

如果想识别其他语言，可以从语言库中下载，地址:https://github.com/tesseract-ocr/tessdata

将下好的.traineddata放到tessdata目录下

接下来就可以用chi_sim（中文简体解析）

参考文章：https://www.cnblogs.com/qq21270/p/7704952.html

小白223

发布了7 篇原创文章 · 获赞 5 · 访问量 3471

私信关注

猜你喜欢

转载自blog.csdn.net/babing18258840900/article/details/88528145

Python 用 Tesseract识别图片提取文本

python tesseract图片识别

python用tesseract-ocr做图像识别

用Python提取视频中的图片

python 使用tesseract进行图片识别

用python提取文本中的数字, 文本复制

用Python将文本转为图片

吴裕雄--天生自然python学习笔记：python 用 Tesseract 识别验证码

python实战===用python识别图片中的中文

用Python从视频中提取每一帧的图片

用Python提取Redis数据

linux下python使用tesseract-ocr进行图片识别

python 包的使用（二）——tesseract识别图片中的文字

图片文字识别：Tesseract OCR库在Python中基本使用

Python Opencv实践 - 入门使用Tesseract识别图片中的文字

图像识别学习记录——用tesseract-ocr程序识别图片中的数字

用LDA处理文本(Python)

用python实现语音识别

用python识别一张数字图片

用Python做了个图片识别系统(附源码)

用百度文字识别实现图片文本识别

用Python从网站爬图片

用python抓取图片代码

用python来分割图片

用python批量下载图片

用python读取图片并显示

用python抓取网页的图片

用Python爬取图片

Python用图片生成gif

关于用tesseract和tesserocr识别图片的一个问题

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)