Pytorch并行和分布式 - 代码天地

Pytorch并行和分布式

其他 2021-03-20 03:21:59 阅读次数: 0

从PyTorch v1.6.0开始，中的功能torch.distributed可以分为三个主要组件：

分布式数据并行培训（DDP）是一种广泛采用的单程序多数据培训范例。使用DDP，可以在每个流程上复制模型，并且每个模型副本都将获得一组不同的输入数据样本。DDP负责梯度通信，以保持模型副本同步，并使其与梯度计算重叠，以加快训练速度。
基于RPC的分布式培训（RPC）旨在支持无法适应数据并行培训的常规培训结构，例如分布式管道并行性，参数服务器范式以及DDP与其他培训范式的组合。它有助于管理远程对象的生命周期，并将自动分级引擎扩展到机器范围之外。
集体通信（c10d）库支持跨组内的进程发送张量。它提供了集体通信API（例如 all_reduce 和all_gather）和P2P通信API（例如 send 和isend）。DDP和RPC（ProcessGroup后端）是从v1.6.0版本起的c10d构建的，其中前者使用集体通信，而后者使用P2P通信。通常，开发人员无需直接使用此原始通信API，因为上述DDP和RPC功能可以满足许多分布式培训方案的需求。但是，在某些情况下，此API仍然很有帮助。一个示例是分布式参数平均，其中应用程序希望在向后传递之后计算所有模型参数的平均值，而不是使用DDP来传递梯度。这可以使通信与计算脱钩，并允许对通信内容进行更细粒度的控制，但另一方面，它也放弃了DDP提供的性能优化。在与PyTorch编写分布式应用程序显示了使用c10d通信API的示例。

待续。。。。。。。。。。。。。。。。。。

猜你喜欢

转载自blog.csdn.net/wzhrsh/article/details/110074420

Pytorch并行和分布式

Pytorch分布式数据并行(DistributedDataParallel)

PyTorch 1.4 发布：支持 Java 和分布式模型并行训练

Pytorch 分布式并行DDP 卡死挂起

【深入了解PyTorch】PyTorch分布式训练：多GPU、数据并行与模型并行

【分布式训练】基于Pytorch的分布式数据并行训练

【PyTorch教程】如何使用PyTorch分布式并行模块DistributedDataParallel(DDP)进行多卡训练

分布式计算和并行计算差异

并行化的世界--分布式硬件和分布式操作系统

[源码解析] PyTorch分布式优化器(2)----数据并行优化器

[源码解析] PyTorch分布式优化器(3)---- 模型并行

【深度学习框架】pytorch之分布式数据并行化DDP

PyTorch分布式训练 PyTorch分布式训练

PyTorch分布式训练

pytorch分布式基础

Pytorch 分布式训练

深度学习的分布式训练--数据并行和模型并行

[源码解析] PyTorch 分布式(1)------历史和概述

分布式，网格及并行计算

并行分布式框架 Celery

Python 并行分布式框架 Celery

python并行编程 - 分布式篇

并行计算与分布式计算

分布式并行计算

python并行分布式框架Celery

分布式并行计算MapReduce

多线程并行与分布式执行

[spring 并行6]分布式

BeeGFS分布式并行集群部署

Mapreduce分布式并行编程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)