公开课视频（六）：飞桨分布式训练有哪些特点？ - 代码天地

公开课视频（六）：飞桨分布式训练有哪些特点？

其他 2020-01-14 21:08:04 阅读次数: 0

今天我们为大家带来的课程是：《飞桨分布式训练简介》

飞桨分布式训练的特点：

1.分布式High-Level API Fleet

分布式训练统一API，支持参数服务器（Parameter Server）和Collective模式训练，大幅度降低用户从单机切换到多机训练的新增代码量。
用户可以通过配置分布式策略调用不同的并行训练方法，对于不同的分布式环境支持多种内建RoleMaker，方便用户调用。

2.参数服务器（Parameter Server）训练新增Communicator设计

独立通信逻辑到Communicator，简化异步训练逻辑；
提供可控制通信开关，可针对不同模型针对性调优。

3.GPU多机多卡增加多个提升扩展性Feature，NLP/CV经典模型下多机多卡训练提速50%

新增Fused All Reduce：通过对gradient tensor进行自动合并，降低参数同步次数；
新增Hierachical All Reduce：层次化all reduce操作；
新增All Reduce通信并发能力：增加多机训练下，训练对网络波动的容忍能力；
新增反向与优化算法之间的依赖分析：提升通信与计算overlap并发的能力；

以上新增能力融合可实现在Bert Large(batch 16 x 128)和Resnet50(batch 32)上多机(v100 8*4 卡)训练速度比PaddlePaddle1.4.1提速50%+。

4.CPU-GPU异构设备流水线并行能力支持

新增流水线并行能力，可支持用户自定义在异构硬件分配计算OP，通过流水线交换数据，从而实现异构计算设备的搭配和计算资源的自由配比，提升训练速度
在IO量大、计算量较小的场景例如CTR预估，Graph Neural Network下相比纯GPU训练有明显速度优势。

此外，GPU多机多卡Benchmark更新：
ResNet50、VGG16、Transformer和Bert上的速度对比，并提供可复现的benchmarks脚本。

以下视频来自2019百度AI开发者大会飞桨深度学习公开课的现场。

点击这里查看视频

点击这里查看PPT

PaddlePaddle开发者

发布了116 篇原创文章 · 获赞 1 · 访问量 4558

私信关注

猜你喜欢

转载自blog.csdn.net/PaddleLover/article/details/103978046

公开课视频（六）：飞桨分布式训练有哪些特点？

公开课视频(二):飞桨预训练模型平台PaddleHub

公开课视频（四）：飞桨模型压缩库PaddleSlim应用与实战（下）

公开课视频（三）：飞桨模型压缩库PaddleSlim应用与实战（上）

公开课视频( 一 ):飞桨强化学习框架Parl解析

DBLE核心研发主讲：MySQL分布式中间件公开课开课啦

自学IT有哪些比较好的MOOC公开课

Oracle网络公开课《11g OCM考试新大纲部署分布式数据库》

谈谈分布式事务有哪些特点？

浅析HDFS分布式存储有哪些优势特点

分布式数据库有哪些特点

Apollo公开课六：规划

【实训公开课】《OpenCV4嵌入式开发训练营》，来了！

【马士兵认证下的】公开课|Java/架构师/大数据/区块链/高并发/分布式/机器学习/人工智能

公开课网址

网易公开课

全球公开课

公开课

公开课汇总

肖臻公开课（六）——比特币中的网络

如何下载网易公开课视频（转载）

数据结构、算法众多公开课视频连接

web前端开发公开课视频资料全集

公开课视频-浅谈前端性能测试

公开课视频-面霸是怎样炼成的

网易公开课APP如何修改视频缓存地址

区块链的分布式网络结构有哪些特点？

多项式事件模型、神经网络模型-机器学习公开课第六讲

有奖评选 | 2020年的AI技术公开课，你想听到哪些干货？

老男孩公开课有感

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)