简单易懂的 pytorch 使用 DistributedDataParallel 进行单机多卡训练 - 代码天地

简单易懂的 pytorch 使用 DistributedDataParallel 进行单机多卡训练

企业开发 2023-09-15 18:21:49 阅读次数: 0

首先放一个官方的案例，照着案例改就行

import torch
import torch.distributed as dist
import torch.nn as nn
import torch.optim as optim

from torch.nn.parallel import DistributedDataParallel as DDP

class ToyModel(nn.Module):
    def __init__(self):
        super(ToyModel, self).__init__()
        self.net1 = nn.Linear(10, 10)
        self.relu = nn.ReLU()
        self.net2 = nn.Linear(10, 5)

    def forward(self, x):
        return self.net2(self.relu(self.net1(x)))


def demo_basic():
    dist.init_process_group("nccl")
    rank = dist.get_rank()
    print(f"Start running basic DDP example on rank {
      
      rank}.")

    # create model and move it to GPU with id rank
    device_id = rank % torch.cuda.device_count()
    model = ToyModel().to(device_id)
    ddp_model = DDP(model, device_ids=[device_id])

    loss_fn = nn.MSELoss()
    optimizer = optim.SGD(ddp_model.parameters(), lr=0.001)

    optimizer.zero_grad()
    outputs = ddp_model(torch.randn(20, 10))
    labels = torch.randn(20, 5).to(device_id)
    loss_fn(outputs, labels).backward()
    optimizer.step()

if __name__ == "__main__":
    demo_basic()

运行的时候执行 torchrun --nproc_per_node=8 elastic_ddp.py就可以了，8是说单机上有多少显卡
需要注意的几点：

DataSet 和 DataLoader 尽量使用 pytorch 的
之后参与计算的数据，例如代码中的labels，都需要to(device_id)

猜你喜欢

转载自blog.csdn.net/Defiler_Lee/article/details/127935889

简单易懂的 pytorch 使用 DistributedDataParallel 进行单机多卡训练

【PyTorch教程】如何使用PyTorch分布式并行模块DistributedDataParallel(DDP)进行多卡训练

pytorch基于DistributedDataParallel进行单机多卡的分布式训练

pytorch DistributedDataParallel多卡并行训练

PyTorch多卡分布式训练DistributedDataParallel 使用方法

使用Pytorch进行多卡训练

PyTorch中DistributedDataParallel使用笔记

PyTorch 单机多卡训练

【AI实战】分布式训练：使用DistributedDataParallel实现单机多GPU并行训练resnet50模型

[源码解析] PyTorch 分布式(5) ------ DistributedDataParallel 总述&如何使用

Pytorch分布式数据并行(DistributedDataParallel)

Pytorch-如何使用GPU进行训练

PyTorch 使用 NVLink 进行模型训练

单卡训练改为DistributedDataParallel训练

pytorch模型训练单机多卡(二)：数据并行DataParallel

Pytorch——distributed单机多卡分布式训练

5 种 PyTorch 并行训练方法（单机多卡）

Pytorch多卡训练

【mmopenlab系列使用DP模式进行单机多卡训练】windows下命令行和linux下面的 .sh 文件使用一文解决 | 商汤科技

pytorch GPU分布式训练单机单卡、单机多卡

使用Fluid进行单机训练

pytorch使用多GPU进行训练batch加载的数据只有1/GPUS

PyTorch多GPU训练模型——使用单GPU或CPU进行推理的方法

[Notes] Pytorch中DDP(DistributedDataParallel)指定显卡/GPU运行的方式

pytorch 使用单个GPU与多个GPU进行训练与测试

【Pytorch】使用训练好的模型进行图像分类预测

4. 使用预训练的PyTorch网络进行图像分类

详解PyTorch项目使用TensorboardX进行训练可视化

如何使用 PyTorch 进行半精度、混(合)精度训练

pytorch 多卡并行训练

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)