GPU: 多GPU训练的同步模式和异步模式 - 代码天地

GPU: 多GPU训练的同步模式和异步模式

其他 2018-10-24 13:26:54 阅读次数: 0

TensorFlow可以用单个GPU，加速深度学习模型的训练过程，但要利用更多的GPU或者机器，需要了解如何并行化地训练深度学习模型。

常用的并行化深度学习模型训练方式有两种：同步模式和异步模式。

下面将介绍这两种模式的工作方式及其优劣。

如下图，深度学习模型的训练是一个迭代的过程。

在每一轮迭代中，前向传播算法会根据当前参数的取值，计算出在一小部分训练数据上的预测值，然后反向传播算法，再根据损失函数计算参数的梯度并更新参数。

异步模式的训练流程图

在并行化地训练深度学习模型时，不同设备（GPU或CPU），可以在不同训练数据上，运行这个迭代的过程，而不同并行模式的区别在于，不同的参数更新方式。

异步模式的训练流程

从异步模式的训练流程图中可以看到，在每一轮迭代时，不同设备会读取参数最新的取值。

–但因为不同设备，读取参数取值的时间不一样，所以得到的值也有可能不一样。

根据当前参数的取值，和随机获取的一小部分训练数据，不同设备各自运行反向传播的过程，并独立地更新参数。

–可以认为异步模式，就是单机模式复制了多份，每一份使用不同的训练数据进行训练。

同步模式深度学习训练

在同步模式下，所有的设备同时读取参数的取值，并且当反向传播算法完成之后同步更新参数的取值。

单个设备不会单独对参数进行更新，而会等待所有设备都完成反向传播之后再统一更新参数。

分析

图中在每一轮迭代时，不同设备首先统一读取当前参数的取值，并随机获取一小部分数据。

然后在不同设备上运行反向传播过程得到在各自训练数据上参数的梯度。

当所有设备完成反向传播的计算之后，需要计算出不同设备上参数梯度的平均值，最后再根据平均值对参数进行更新。

猜你喜欢

转载自blog.csdn.net/wfei101/article/details/82947092

GPU: 多GPU训练的同步模式和异步模式

GPU

【GPU】

TF 设置GPU模式训练

tensorflow 多GPU训练

keras多gpu训练

pytorch 多GPU 训练

bert多GPU训练

【Pytorch】多GPU训练

pytorch多GPU训练

pytorch 多GPU训练

keras 多GPU训练，单GPU预测

单机多GPU训练报错

Huggingface：高效多GPU训练

pytorch 多GPU训练 pytorch 多GPU训练 pytorch-multi-gpu

使用Keras进行多GPU训练 multi_gpu_model

【pytorch实用小技巧】单gpu与多gpu训练与评估

Android GPU呈现模式分析

CUDA（三）——GPU属性查看，多GPU时，设置GPU

高版本Keras多GPU和分布式训练（Multi-GPU and distributed training）

keras实现多GPU或指定GPU的使用

keras实现多gpu训练，单gpu保存模型，单gpu预测

Tensorflow指定GPU训练

制定GPU训练

【Tensorflow】指定GPU训练

GPU AI 模型训练

指定GPU训练模型

tensorflow使用GPU训练

Pytorch：使用GPU训练

解决单GPU训练

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)