几行代码教你OCR的正确姿势

其他 2019-03-18 02:31:21 阅读次数: 0

版权声明：本文由YSilhouette原创，转载请务必标出原文地址 https://blog.csdn.net/qq_16123129/article/details/88033767

什么是OCR？

我们来看一下百度百科给的定义：

OCR （Optical Character
Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；

我简要的总结为：

        OCR三步走："内容——> 扫描——>结果"

今天来用代码的形式讲一下，怎么用代码快速实现OCR。

pytesseract

Python-tesseract是谷歌Tesseract-OCR （http://code.google.com/p/tesseract-ocr/）的包装器。它作为独立的调用脚本也很有用，因为它可以读取Python Imaging Library支持的所有图像类型，包括jpeg，png，gif，bmp，tiff 等，默认情况下tesseract-ocr只支持tiff和bmp。

Python-tesseract 支持版本为 python 2.7+ 或 python 3.x，接下来我们安装pytesseract

# 安装pytesseract
pip install pytesseract
安装完成以后导入使用

# 导入
import pytesseract

PIL

PIL(Python Image Library)是python的第三方图像处理库，但是由于其强大的功能与众多的使用人数，几乎已经被认为是python官方图像处理库了。

# 导入PIL
from PIL import image

接下来就是最最最最最最精髓的地方啦～～～～～～～～～～

实现读取解析的几行代码：

# 读取image
image = Image.open('你的文件路径／图片名.png')
# 识别image上的文字
content_text=pytesseract.image_to_string(image)
# 打印文字
print(content_text)

这样OCR就成功啦！

完整代码如下：

扫描二维码关注公众号，回复： 5568226 查看本文章

#!/usr/env/bin/python
# 用于设置输出内容编码，避免乱码
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')

# 导入关键库
from PIL import Image
import pytesseract

image = Image.open('你的文件路径／图片名.png')
content_text=pytesseract.image_to_string(image)
print(content_text)

签名：在未来面前，我们都是孩子。学习、思考才能让我们越走越远。

学习博客：oceaneyes.top

个人网站：www.oceaneyes.cn
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_16123129/article/details/88033767

几行代码教你OCR的正确姿势

【转】田渊栋教你读paper的正确姿势

想要掌握正确的沟通姿势？历途来教你

Python几行代码教你学会海龟制图

几段代码几行解析教你读懂cookie

几行代码教你彻底明白属性到底存在与否

教你如何正确的拆分JavaScript代码

写代码并不枯燥“用Python几行代码教你画出太阳花”

面试全攻略，教你解锁程序员面试时的正确姿势

手把手教你使用XUI的正确姿势

一文教你如何开启Eclipse的正确安装使用姿势

ES6 - 手摸手教你解构后台特定字段的正确姿势

【重磅分享】免梯子GPT，教你玩转GPT正确姿势

教你几行代码实现全平台端口数据的转发

几行代码教你解决Android studio中gradle同步过慢的问题

几行代码教你轻松瓜分双十一20亿红包

教你用python编写二十几行的代码绘制动态烟花

十几行代码教你封装基于bootstrap的前端分页组件

几行代码，轻松教你用Java 将 Word 文档转换为 HTML

提高代码速度的“正确姿势”

Python3.6使用tesseract-ocr的正确姿势

你的API还在裸奔？阿里大师带你领悟安全的代码正确姿势

【小家java】Java中的线程池，你真的用对了吗？（教你用正确的姿势使用线程池）

10几行代码，用python打造实时截图识别OCR

垂直同步到底要不要开？老司机教你G-Sync显示器的正确打开姿势

ThreadLocal能解决线程安全问题？胡扯！本文教你正确的使用姿势【享学Java】

想要更换和手机壳一样的颜色主题？教你用几行Python代码轻松搞定

几行代码教你轻松完成超大模型推理：LLaMA-30B+TITAN RTX*4+accelerate

福利！你要的入门HBase正确姿势

Git Bash 提交代码的正确姿势

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)