AI首席架构师12-AICA-百度OCR垂类规模化落地实践

0、介绍

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1、百度OCR简介

算法-数据-产品的闭环
在这里插入图片描述
技术架构,算法》开发》部署》应用
在这里插入图片描述

2、垂类介绍

在这里插入图片描述
光学识别,识别的准确,结构化理解
在这里插入图片描述
挑战,数据少,语义知识,泛华性
在这里插入图片描述
建设路径,通用》高频垂类》高频场景》复杂

在这里插入图片描述
通用OCR
在这里插入图片描述
垂类
在这里插入图片描述
场景结构化方案,全流程的质量控制,不单单是算法
在这里插入图片描述
复杂场景,前处理和后处理的干预,本质是矩阵+概率论,本身是没有确定性的
在这里插入图片描述
规模化,现状总结
在这里插入图片描述

3、百度OCR垂类规模化技术路径

在这里插入图片描述
挑战,少数据、共享、小模型、解决方案
在这里插入图片描述
标准化流程
在这里插入图片描述
前置预处理
在这里插入图片描述
版式
在这里插入图片描述
结构化方案Eaten,每个实体都镜像解码在这里插入图片描述
结构化方案,EnDet,直接当做一个目标检测问题
在这里插入图片描述
方案
在这里插入图片描述
多模态方案,就跟人的理解那样
在这里插入图片描述
同时学到视觉和语义
在这里插入图片描述
识别的挑战
在这里插入图片描述
识别大模型方案MaskOCR
在这里插入图片描述
模型小型化
在这里插入图片描述

4、规模化解决方案

在这里插入图片描述
案例应用
在这里插入图片描述
训练平台特点
在这里插入图片描述
平台化案例
在这里插入图片描述
案例介绍,三分之一的时间客户驻场
在这里插入图片描述
总结
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_15821487/article/details/126022587