Pytorch 分布式训练（DP/DDP）

企业开发 2023-09-12 04:17:10 阅读次数: 0

概念

PyTorch是非常流行的深度学习框架，它在主流框架中对于灵活性和易用性的平衡最好。

分布式训练根据并行策略的不同，可以分为模型并行和数据并行。

模型并行

模型并行主要应用于模型相比显存来说更大，一块 GPU 无法加载的场景，通过把模型切割为几个部分，分别加载到不同的 GPU 上，来进行训练

数据并行

这个是日常会应用的比较多的情况。即每个 GPU 复制一份模型，将一批样本分为多份分发到各个GPU模型并行计算。因为求导以及加和都是线性的，数据并行在数学上也有效。采用数据并行相当于加大了batch_size，得到更准确的梯度或者加速训练

常用的 API 有两个：

torch.nn.DataParallel(DP)
torch.nn.DistributedDataParallel(DDP)
DP 相比 DDP 使用起来更友好（代码少），但是 DDP 支持多机多卡，训练速度更快，而且负载相对要均衡一些。所以优先选用 DDP 吧。

参考

Pytorch 分布式训练（DP/DDP）_pytorch分布式训练_ytusdc的博客-CSDN博客

PyTorch分布式训练简明教程(2022更新版) - 知乎

扫描二维码关注公众号，回复： 16628612 查看本文章

Pytorch分布式训练 - 知乎

Pytorch多机多卡分布式训练 - 知乎

Pytorch - 多机多卡极简实现（附源码） - 知乎

猜你喜欢

转载自blog.csdn.net/linzhiji/article/details/132760406

Pytorch 分布式训练（DP/DDP）

Pytorch DDP 分布式训练实例

【教程】Pytorch DDP 分布式训练详解

上手Pytorch分布式训练DDP

【PyTorch教程】如何使用PyTorch分布式并行模块DistributedDataParallel(DDP)进行多卡训练

Pytorch 分布式并行DDP 卡死挂起

PyTorch分布式训练 PyTorch分布式训练

PyTorch分布式训练

Pytorch 分布式训练

PyTorch 分布式训练教程

Pytorch分布式训练错误

TensorFlow、PyTorch分布式训练

pytorch分布式训练简单总结

Pytorch DDP分布式数据合并通信 torch.distributed.all_gather()

【深度学习框架】pytorch之分布式数据并行化DDP

分布式并行训练（DP、DDP、DeepSpeed）

【分布式训练】基于PyTorch进行多GPU分布式模型训练（补充）

【分布式训练】基于Pytorch的分布式数据并行训练

分布式训练DDP的那些坑

pytorch-GPU分布式训练笔记

[深度学习] Pytorch 1.0 分布式训练初探

PyTorch分布式训练踩坑记

Pytorch之分布式训练 —— Data Parallel

Pytorch——distributed单机多卡分布式训练

RuntimeError: Address already in use pytorch分布式训练

Pytorch分布式训练与断点续训

PyTorch 分布式训练 --- 数据加载之DistributedSampler

pytorch多GPU分布式训练代码编写

pytorch分布式训练报错RuntimeError: Socket Timeout

Pytorch基础训练库Pytorch-Base-Trainer(支持模型剪枝分布式训练)

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)