OCR Roadmap - 代码天地

OCR Roadmap

其他 2019-09-30 07:47:54 阅读次数: 0

预习阶段 OCR基础：CNN和RNN

CNN预习视频：卷积神经网络与计算机视觉

知识点1：卷积神经网络结构分析
知识点2：过拟合与随机失活
知识点3：卷积神经网络理解
知识点4：典型网络结构详解
实战项目：利用ResNet与inception解决一般图像分类问题套路

RNN预习视频：循环神经网络与自然语言处理

知识点1：循环神经网络
知识点2：长时依赖问题与长短时记忆网络
知识点3： BPTT算法
实战项目：利用循环神经网络生成文本作诗

第一阶段一览OCR技术和字符识别

第一课 OCR技术概览

知识点1：什么是OCR
知识点2：常见应用概览，比如印刷体识别：文档识别、车牌识别、证照/名片/票据识别、视频/图像理解、拍照搜题等，以及手写识别：在线识别、离线识别
知识点3：基本流程：预处理、版面分析、文本行定位、字符识别、后处理
知识点4：常见OCR工具：Tesseract、Abbyy、百度OCR API、科大讯飞OCR API
实战项目： Tesseract 搭建第一个OCR引擎

第二课单字符分割与识别

知识点1：单字符识别（模版匹配、特征提取 + 传统分类器、CNN模型）
知识点2：字符分割1：定位候选分割位置（基于投影规则的候选位置提取、基于模型的候选位置提取）
知识点3：字体分割2：分割路径选择（Viterbi算法 / Beam Search、PCFG / 2D-PCFG）
实战项目：基于CNN的单字符识别与过分割

第三课字符序列识别

知识点1：概览RNN以及LSTM + CTC、CRNN、RARE
知识点2：概览注意力机制Attention，以及DRAM / DRAW、Transformer
实战项目：实战CNN和RNN的综合体CRNN

第二阶段：掌握文本定位与文本检测

第四课文本行定位

知识点1：传统方法（基于投影的文本行定位、基于最小生成树的文本行定位）
知识点2：深度学习（Full-Page Text Recognition: Learning Where to Start and When to Stop、Learning Text-Line Localization with Shared and Local Regression Neural Networks、TextSnake）
实战项目：实战Text Line Extraction Based on MST

第五课自然场景中的文本检测

知识点1： Reading Text in the Wild with Convolutional Neural Networks
知识点2： CTPN、RRPN、FTSN、DMPNet、EAST
知识点3： SegLink、PixelLink
知识点4： Textboxes、WordSup、FOTS
实战项目：实战场景文本检测之CTPN算法

第三阶段掌握其他图像问题

第六课图像质量增强和预处理

知识点1：图像增强（去模糊、超分辨率重建）
知识点2：二值化（全局阈值、局部阈值：克服局部光照和噪声、基于学习的方法）
知识点3：旋转 / 扭曲变形（角度估计与矫正、扭曲复原与DocUNet）
实战项目：实战生成对抗网络GAN的变体SRGAN

猜你喜欢

转载自www.cnblogs.com/cirual/p/11610723.html

OCR Roadmap

RoadMap

ROADMAP roadmap

roadmap目标

OpenDJ Roadmap

HI Roadmap

OCR

2015impala roadmap

性能优化实践Roadmap

微软的竞争roadmap

web作业2：roadmap

GNN paper read roadmap

前段学习的roadmap

TensorFlow Learning roadmap

Linux技术学习roadmap

[devel] Roadmap 0.99.5 - update

The Java Developer Roadmap

aspnetcore-developer-roadmap

Intel Core Microarchitechture Roadmap

Flutter 2023 Roadmap 解析

Databend Roadmap in 2023

Imagination GPU Roadmap

FAQ - SAP BW BO roadmap

RAD Studio August 2018 Roadmap

一篇无厘头的Roadmap

方正微 2007-2014 roadmap

[DBA成长之路] DB2 Roadmap

精准医疗|研发药物|Encode|roadmap|

JS高级---学习roadmap---5 parts

【OCR 介绍】

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)