DeepSpeed之ZeRO系列：将显存优化进行到底 - 代码天地

DeepSpeed之ZeRO系列：将显存优化进行到底

企业开发 2023-06-21 16:21:32 阅读次数: 0

前言

目前训练超大规模语言模型主要有两条技术路线：TPU + XLA + TensorFlow/JAX 和 GPU + PyTorch + Megatron-LM + DeepSpeed。前者由Google主导，由于TPU和自家云平台GCP深度绑定，对于非Googler来说，只可远观而不可把玩，后者背后则有NVIDIA、Meta、MS大厂加持，社区氛围活跃，也更受到群众欢迎。

上面提到的DeepSpeed的核心是ZeRO(Zero Redundancy Optimizer)，简单来说，它是一种显存优化的数据并行(data parallelism, DP)方案。而“优化“这个话题又永无止境，在过去两年DeepSpeed团队发表了三篇ZeRO相关的论文，提出了去除冗余参数、引入CPU和内存、引入NVMe等方法，从始至终都围绕着一个目标：将显存优化进行到底。

ZeRO: 一种去除冗余的数据并行方案

ZeRO: Memory Optimizations Toward Training Trillion Parameter Models 发表在SC 20，DeepSpeed项目最初就是论文中ZeRO方法的官方实现。

背景

如今训练大模型离不开各种分布式并行策略，常用的并行

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131248014

DeepSpeed之ZeRO系列：将显存优化进行到底

将数据库优化进行到底！！

【小程序实战】- 将图片优化进行到底

将Android进行到底之广播（Broadcast）

阿里将开源进行到底！

红帽：将开源进行到底

将极致进行到底，UIBI柚比推出“致”系列GaN充电器

G99、将测试进行到底 - G系列总纲

永无止境将SEO进行到底

华为，将智能计算进行到底

将js进行到底：node学习8

将js进行到底：node学习7

将js进行到底：node学习6

将js进行到底：node学习10

将js进行到底：node学习9

将Java进行到底。Collections专题介绍

<<了不起的Node.js:将JavaScript进行到底>>试读

《了不起的Node.js 将JavaScript进行到底》试读心得

副业笔记：如果将企业网站进行到底

将APP保卫战进行到底--为你的APP添加四道防线

官宣！——放出多款框架，免费并允许商用，将开源进行到底！

《惢客创业日记》2019.02.06（周三）将疯狂进行到底

将函数式进行到底，用 Hooks 武装组件 - TXD 前端月刊 201905 期

阿里云CDN领跑全球加速 618将普惠进行到底

百度：如何将AI进行到底？

将白嫖进行到底？简单爬虫爬取B站视频

未被定义的 “智能座舱”，如何将产业化进行到底

新冠数据全不可信？将宅家进行到底

无论风吹雨打将市场实话实说进行到底

将刷脸支付进行到底渗透到生活的每一处

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)