OCR：你不来我不老 - 代码天地

OCR：你不来我不老

其他 2018-08-10 05:16:36 阅读次数: 0

OCR （Optical Character Recognition，光学字符识别），简单来说，就是终端设备借助摄像头，将手写文字或印刷体文字，从图片上抠出来，变成计算机可以识别且编辑的字符串的过程。

其实这个过程可分为两大步骤：图像处理and文字识别。下面，我简单跟大家分享一下这个技术的原理。

图像处理：

图像处理这个过程又包含了灰度化、二值化、降噪、倾斜矫正、文字切分等子步骤。

灰度化：即将一张彩色图片变为只有黑白两种颜色的图片。

二值化：就是在黑白图片的基础上，将图片设定为只有纯白和纯黑两种颜色，不包含灰度。

图像降噪：一幅图像包括目标物体、背景还有噪声。数字图像在数字化和传输过程中会受到噪声干扰的影响，会形成零零散散的小黑点，这时候，经过降噪处理，去除小黑点，是非常重要的。

倾斜矫正：这个相信大家都好理解，拍照都会出现倾斜的问题，很难做到绝对水平。这时候需要对图像进行矫正，来寻求一个最大程度的水平位置。

字符切分：将一段文字的每个字符切割出来，形成一个单字符，不会形成连体字，便于识别。

图像处理完毕后，就到了我们的文字识别：

需要提取文字的特征，丢给分类器进行分类，它会告诉你依据这个特征，会形成哪一个文字。最后识别出来的文字会经过最后的后处理，也就是语言模型（涉及到自然语言理解的范畴），形成“通顺”的语句。

其实OCR涉及的算法很复杂，但以上，或许大家都能对OCR了解个三三四四。

在20世纪90年代，与清华大学的携手合作过程中，文通科技成功地将"国家863计划"项目成果——"文字图像识别技术TH-OCR"产业化，才预示着与OCR与市场应用的结合。真正促使OCR技术飞速发展的是互联网+时代的到来。

人工智能时代刚刚起步，OCR永不会老。

欢迎百度“于洪康” ，即可获取识别开发包和测试授权，进行接口开发及软件测试。

猜你喜欢

转载自blog.csdn.net/wintone_Hawke/article/details/81220122

OCR：你不来我不老

青年节丨你要的我们懂得，时光不老我们不散

我们的小太阳钟汉良，不老男神，希望你继续帅下去

移动端车牌识别OCR识别流程，你还不来get一下么？

时光静好，我亦不老倾我一生一世，换取岁月静好。如若岁月静好，我亦微笑，亦不老。

资讯太少不够看？我们敞开投递通道啦，你来不来？

我用Kotlin写了一个精美的应用，你确定不来看下么

你说要你想玩爬虫，但你说你不懂Python正则表达式，我信你个鬼，那你还不来看看？

Python web简约表白网页源码分享，时光不老，我们不散！

程序员为了让公司裁掉自己，故意旷工不来去上班，公司：我不会裁掉你的

这么好用的离线OCR项目，我要摁着“狗头”安利给你

我们能在22岁的身体中活到130岁？人类离“长生不老”有多远

我的ocr训练记录

不老的神器--namp，awvs

老实与不老实

论老与不老的标准

C语言，不老的传说

Android应用保活方案的另类出路，让你应用长生不老(针对小米手机)

浅谈我对OCR行业的理解

内外双修的女人才不老

stdu1309(不老的传说)

0204-宝刀不老

未来已来，你来不来

Redis进阶(面试高频，工作重点)主从复制，哨兵模式，缓存穿透，缓存击穿和雪崩，想要提升自己或者高薪入职的人都去了解的东西，你不来看看吗？反正我懂了

为什么我的mongodb突然起不来了？

“老板，对不起！我胃不好，您给的饼我消化不来”，我去腾讯吃“软饭”了！

我的2018：OCR、实习和秋招

yzoj P2045 不老的传说题解

『不老』程序员之修炼指南

今天是六一儿童节~身为我们班的信息担当的我为我们班同学准备了一个小惊喜，你确定不来看看吗（turtle库实现：送给同学们一朵小红花）

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)