DeepSpeed通过系统优化加速大模型推理 - 代码天地

DeepSpeed通过系统优化加速大模型推理

企业开发 2023-06-19 14:16:18 阅读次数: 0

原文地址：DeepSpeed: Accelerating large-scale model inference and training via system optimizations and compression
原文作者：DeepSpeed Team Rangan Majumder , Vice President Andrey Proskurin , Corporate Vice President of Engineering
译文出自：dl_system
本文永久链接：DeepSpeed 通过系统优化加速大模型推理
译者：harleyszhang，译者对原文有所删改和优化。

一，背景知识

1.1，LLM 应用的难点

1，模型训练时间过长

伴随着 Transformer 结构的提出，后续 LLM 参数开始从亿级到百亿、乃至万亿级增长，与超高速增长到模型参数量相比， GPU 显存的增长实属有限，有数据显示每 18 个月仅翻了 1.7 倍。模型参数量的增长和硬件的显存的增长之间的差距越来越大，但从目前趋势看&#

猜你喜欢

转载自blog.csdn.net/qq_20986663/article/details/130695234

DeepSpeed通过系统优化加速大模型推理

DeepSpeed加速大模型训练

PTM：大模型加速方法或框架(预训练阶段/推理阶段)的简介、常用框架(Megatron-LM/Colossal-AI/DeepSpeed等，FastLLM/vLLM等)、案例应用之详细攻略

大模型 Serverless 推理系统

DeepSpeed Ulysses: 训练极长序列Transformer模型的系统优化

深度学习实战——模型推理优化（模型压缩与加速）

大模型推理加速框架vllm部署的实战方案

向量数据库—加速大模型训练推理

TensorRT模型加速 | 网络结构优化 | 低精度推理

“烧钱”的大模型：初探成本拆解与推理优化方法

详谈大模型训练和推理优化技术

DeepSpeed Chat大模型训练【训练类ChatGPT 的大模型】

推理加速性能超越英伟达FasterTransformer 50%，开源方案打通大模型落地关键路径

LLM Accelerator：使用参考文本无损加速大语言模型推理

fastllm 大模型cuda推理加速源码解析之 CMakelist.txt

用BigDL-LLM 即刻加速百亿级参数LLM推理 | 最“in”大模型

使用TensorRT加速Pytorch模型推理

使用tensorrt为模型推理加速

[深度学习]大模型训练之框架篇-DeepSpeed

[深度学习]大模型训练之框架篇--DeepSpeed使用

DeepSpeed：大模型训练框架 | 京东云技术团队

语言大模型的推理技巧

如何给深度学习加速——模型压缩、推理加速

【OpenVino CPU模型加速（二）】使用openvino加速推理

一文了解 LCL：可通过“因果推理”增强多模态大模型的学习能力

mnn-llm: 大语言模型端侧CPU推理优化

复旦大学重磅发布低内存优化技术LOMO | 将大模型训练内存使用量降低到10.8%，大幅领先DeepSpeed！

深度学习之模型压缩、加速模型推理

【模型推理加速系列】05: 推理加速格式TorchScript简介及其应用

【模型推理加速系列】07: 以BERT为例全面评测各种推理加速方案

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)