文字检测识别引擎罗塞塔（Roseta） - 代码天地

文字检测识别引擎罗塞塔（Roseta）

其他 2018-09-29 05:17:21 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_14845119/article/details/82718451

论文：Large Scale System for Text Detection and Recognition in Images

Facebook的OCR引擎。OCR部分包括检测和识别2部分。是分别进行检测和识别的框架。检测和识别分开训练。检测模型基于caffe2训练，识别模型基于pytorch训练，最终都部署为caffe2。

检测框架：

检测框架采用faster RCNN中的RPN结构。区别在于基础卷积网络使用的是ShufeNet。

识别框架：

论文中提出了2种结构，

一种为具有多个全连接层的传统识别方法。缺点为，

识别的文本的长度受限制，不能识别文本中单词太多的文本图片，例如URL。
由于最后接了好多全连接层，导致参数较大。

另一种为基于全卷积+CTC的结构，基础结构为ResNet18，注意这里没有使用lstm或者gru或者attention等类似这样的结构。优点为，

网络具有更少的参数
可以预测任意长度的文本

在测试中发现，先将图片按照长宽比缩放为高度固定为32像素，再将宽度进行1.2倍的缩放，可以获得更好的识别效果。

训练过程中采用了warm up的策略。学习率经过了从最小到最大，再到最小的过程。图片的宽度也随着训练逐渐递增，单词长度也随着训练逐渐递增，体验了由易到难的训练思路。

整体结构：

整体框架采用异步的处理流程。最开始接入了类似rabbitMQ或者rocketMQ的中间件作为处理队列。然后消费者从队列中收取图片进行检测+识别的处理。处理结果存储在了TAO数据库（facebook的分布式数据库）中，当然也可以根据业务需要存储在redis或者fdfs中。最后前面服务端再定时从数据库中获取识别结果。

总结：

整体感觉论文不管是算法方面的检测+识别，还是业务逻辑层面的部署，都是正常的逻辑，没有说提出特别有亮点的东西。

猜你喜欢

转载自blog.csdn.net/qq_14845119/article/details/82718451

文字检测识别引擎罗塞塔（Roseta）

罗塞塔小结

罗塞塔总结

罗塞塔怎么学？？？

罗塞塔完成总结

罗塞塔小结（二）

英语罗塞塔感想

罗塞塔运行报错1141

罗塞塔第一遍总结

罗塞塔总结-第一遍

第一遍罗塞塔总结

第二遍罗塞塔总结

第一次罗塞塔总结

罗塞塔第二遍总结博客

第二次罗塞塔学习总结

【英语】罗塞塔第一遍学习总结

提高期英语学习——第二次罗塞塔

第一次罗塞塔学习---收获总结

文字检测与识别资源

文字检测识别

文字检测与识别资源

文字检测与识别

RCNN融合贝塞尔曲线文字识别

罗塞塔石碑Rosetta Stone Mac(语言学习软件)附英式英语语言包

文字的检测与识别资源汇总

文字检测+识别之FOTS

文字检测与识别资料整理

视频文字检测，自然场景文字识别

汉罗塔问题

汉罗塔

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)