【文字识别】Scene Text Recognition With Finer Grid Rectification论文阅读 - 代码天地

【文字识别】Scene Text Recognition With Finer Grid Rectification论文阅读

其他 2020-03-20 10:13:17 阅读次数: 0

地址： 论文
思路： 这篇论文采用矫正再识别的思路进行文字识别，主要有矫正网络和识别网络两大部分，其中矫正网络采用TPS的思路，不过不是和tps一样直接预测2*n个关键点，而是预测中心线，然后加上一个偏置b。识别部分采用GRU实现的attention进行解码，采用了一种新的双向方式替换了aster的方法。具有更好的效果。

3. 论文方法

3.1 矫正网络

矫正网络采用了STN，关键就是如何预测STN网络的控制点。
由于2D场景文本图像中的大多数字符都是沿直线或平滑曲线运动的，所以控制点也具有相同的特性趋势，多项式曲线是有效的估计趋势文本布局。我们可以用带有偏差的曲线来估计每条线的控制点Ci
在这里插入图片描述
矫正网络结构为：

而ASTER等矫正网络的参数个数为MN2，不过这个只有在关键点多的时候才能体现出来。论文说这种偏置的关键点预测方法能更好的包络文字区域。

3.2 识别网络

在这里插入图片描述
相较于ASTER，论文只用了一个解码层，GRU接受一个方向编码实现ASTER两个不同方向编码的效果。
ASTER等方法采用两个不同的分支来预测west和tsew，论文的方法可以在解码部分可以减少1/2的参数。
方向向量由一个独热向量嵌入而来，如1表示正向，0表示反向。

4.结果

在这里插入图片描述
在更区的文字上效果可能更好一点。

总结

优化了STN关键点的产生过程，对更区的文字效果更好
优化了ASTER方法解码部分双向解码时的参数

发布了244 篇原创文章 · 获赞 147 · 访问量 28万+

私信关注

猜你喜欢

转载自blog.csdn.net/u011622208/article/details/104156573

【文字识别】Scene Text Recognition With Finer Grid Rectification论文阅读

Paddle的场景文字识别 (STR, Scene Text Recognition)

论文阅读（XiangBai——【PAMI2018】ASTER_An Attentional Scene Text Recognizer with Flexible Rectification )

【论文阅读】泛读《SqueezedText: A Real-Time Scene Text Recognition by Binary Convolutional Encoder-Decoder》

SPIN: Structure-Preserving Inner Offset Network for Scene Text Recognition —— 论文阅读笔记

Exploring Font-independent Features for Scene Text Recognition —— 论文阅读笔记

SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition ---论文阅读笔记

SRN: Towards Accurate Scene Text Recognition with Semantic Reasoning Networks ---论文阅读笔记

【个人开源】论文复现SRN：Towards Accurate Scene Text Recognition with Semantic Reasoning Networks

论文笔记之Read Like Humans: ABINet for Scene Text Recognition

Adaptive Text Recognition through Visual Matching —— 论文阅读笔记

文献阅读——（第十三篇）ASTER：An Attentional Scene Text Recognizer with Flexible Rectification

基于深度学习的场景文本检测和识别（Scene Text Detection and Recognition）综述

【论文】Text Detection and Recognition in Imagery: A Survey

ASTER：An Attentional Scene Text Recognizer with Flexible Rectification

深度学习论文翻译解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

CVPR 2020-Scene Text Detection&Recognition

ReadLikeHumans: Autonomous,Bidirectional and Iterative Language Modeling for Scene Text Recognition

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

RobustScanner: Dynamically Enhancing Positional Clues for Robust Text Recognition —— 论文阅读笔记

【论文笔记】Deep Structured Output Learning for Unconstrained Text Recognition

【论文阅读】EAST: An Efficient and Accurate Scene Text Detector

[论文阅读] Geometry Normalization Networks for Accurate Scene Text Detection

SCATTER: Selective Context Attentional Scene Text Recognizer --- 论文阅读笔记

论文阅读：Why Can’t I Dance in the Mall Learning to Mitigate Scene Bias in Action Recognition

【转】SEE: Towards Semi-Supervised End-to-End Scene Text Recognition

Learning to Predict More Accurate Text Instances for Scene Text Detection —— 论文阅读笔记

【论文笔记，action recognition,动作识别】

动作识别新论文20191110：action recognition

论文阅读-Open set Recognition

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)