AI首席架构师10-AICA-蓝翔 《飞桨框架设计与核心技术》

0、介绍

在这里插入图片描述
平台
在这里插入图片描述

1、飞桨平台整体介绍

深度学习发展历程
在这里插入图片描述
深度学习框架历程
在这里插入图片描述
飞桨全景图
在这里插入图片描述
面临挑战
在这里插入图片描述
领先技术解决挑战
在这里插入图片描述
动静统一
在这里插入图片描述
高低融合
在这里插入图片描述
简化开发流程
在这里插入图片描述
丰富的模型库
在这里插入图片描述
教程丰富
在这里插入图片描述

2、飞桨训练框架设计与核心技术

用户和产业落地
在这里插入图片描述
训练框架整体架构
在这里插入图片描述
IR,降低复杂度
在这里插入图片描述
统一前端转换和性能
在这里插入图片描述
首创多层IR
在这里插入图片描述
第一次IR
在这里插入图片描述
静态图
在这里插入图片描述
映射
在这里插入图片描述
第二次IR
在这里插入图片描述
动静转换
在这里插入图片描述
动态图包含静态图
在这里插入图片描述
动态转树,树的优化,树生成静态图代码
在这里插入图片描述
树的转换
在这里插入图片描述
分析与转写
在这里插入图片描述
动静转换
在这里插入图片描述

3、性能优化

各个阶段的优化
在这里插入图片描述
混合精度,减少空间加快速度
在这里插入图片描述
面临问题
在这里插入图片描述
解决问题,放大,备份高精度数据
在这里插入图片描述
整体混合精度解决方案
在这里插入图片描述
稀疏化加速
在这里插入图片描述
结构化硬件加速和非结构化软件加速
在这里插入图片描述
硬件加速,压缩
在这里插入图片描述
效果
在这里插入图片描述
模型量化
在这里插入图片描述
量化训练在这里插入图片描述
训练后量化
在这里插入图片描述
量化效果,数据分布
在这里插入图片描述
OP融合优化
在这里插入图片描述
多个融合一个
在这里插入图片描述
纵向融合和横向融合,横向可以后面拆分
在这里插入图片描述
常用
在这里插入图片描述
编码优化
在这里插入图片描述
对比
在这里插入图片描述
算子优化,中间层,专注逻辑不同通用
在这里插入图片描述
在这里插入图片描述
kernel优化体系在这里插入图片描述
效果
在这里插入图片描述
硬件自动感知优化
在这里插入图片描述
效果
在这里插入图片描述

4、深度学习编译器

在这里插入图片描述
XLA
在这里插入图片描述
TVM
在这里插入图片描述
编译器对比
在这里插入图片描述
百度编译器
在这里插入图片描述
训练和推理都可以自动调优
在这里插入图片描述
效果
在这里插入图片描述
总结
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_15821487/article/details/125535585