吴恩达机器学习笔记——照片OCR - 代码天地

吴恩达机器学习笔记——照片OCR

其他 2019-02-20 22:00:51 阅读次数: 0

照片OCR流水线

照片OCR是一种可以识别图片中的文字内容的技术。

照片OCR的流水线可以分为三步：

文本识别
字符分割
字符分类识别

文本识别

给定一组正负样本进行模型训练，从照片中识别出可能是文字的区域，在结果图中，灰度越低，说明判断为文本的概率越大。

去除掉一些形状不合理的部分。使得预判为文本的地方扩大、相连。

滑动窗口

使用一个以一定步长移动的框，对框住的区域使用模型判断是否为正样本。

在本例中，当框被判断为y=1时，就说明是字母切割区域，在中间画一条切割竖线。

字符分类识别

使用字符训练集对模型进行训练，之后用于字符图片的识别。

相似案例

图片中行人的识别：

引入行人的正负样本训练集

由于不管行人距离镜头的远近，行人的长宽比类似，我们使用滑动窗口的方式，使用一定步长的不同大小的方框对图片进行扫描，将框内内容缩放或扩大到和训练集的比例一致后放入模型判断，当前内容是否为一个行人。

最终得到识别结果。

猜你喜欢

转载自blog.csdn.net/weixin_39714797/article/details/87691650

吴恩达机器学习笔记10-照片OCR

吴恩达机器学习笔记——照片OCR

吴恩达《机器学习》课程总结(18)_照片OCR

吴恩达机器学习——第19章照片OCR

吴恩达机器学习笔记 —— 19 应用举例：照片OCR（光学字符识别）

第十八章应用举例：照片OCR-机器学习老师板书-斯坦福吴恩达教授

吴恩达机器学习笔记（一）

吴恩达机器学习笔记（八）

吴恩达机器学习笔记（七）

吴恩达机器学习笔记（六）

吴恩达机器学习笔记（五）

吴恩达机器学习笔记（四）

吴恩达机器学习笔记（三）

吴恩达机器学习笔记（二）

吴恩达机器学习笔记（十三）

吴恩达机器学习笔记（十二）

吴恩达机器学习笔记（九）

吴恩达机器学习笔记（十一）

吴恩达机器学习笔记（十四）

吴恩达机器学习笔记（十）

吴恩达机器学习笔记

吴恩达机器学习笔记一

吴恩达机器学习笔记6

吴恩达机器学习笔记5

吴恩达机器学习笔记4

吴恩达机器学习笔记3

吴恩达机器学习笔记2

吴恩达机器学习笔记1

吴恩达机器学习笔记7

吴恩达机器学习笔记——汇总

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)