Distributed Inference and Fine-tuning of Large Language Models Over The Internet - 代码天地

Distributed Inference and Fine-tuning of Large Language Models Over The Internet

企业开发 2024-01-08 19:05:00 阅读次数: 0

本文是LLM系列文章，针对《Distributed Inference and Fine-tuning of Large Language Models Over The Internet》的翻译。

互联网上大型语言模型的分布式推理与微调

摘要
1 引言
2 背景：高效训练和推理
3 方法
4 实验
5 结论

摘要

大型语言模型（LLM）在许多NLP任务中都很有用，并且随着规模的增加而变得更加强大，最好的开源模型具有超过500亿个参数。然而，使用这些50B+模型需要高端硬件，这使得大多数研究人员无法使用它们。在这项工作中，我们研究了LLM的成本高效推理和微调方法，比较了局部策略和分布式策略。我们观察到，即使在消费级网络中的地理分布设备上，足够大的模型（50B+）也可以有效运行。这可以通过汇集多个研究小组和志愿者的空闲计算资源来高效地运行LLM。我们解决了两个悬而未决的问题：（1）如果任何设备可能突然断开连接，如何可靠地进行推理和微调；（2）如何在硬件不均衡的设备之间划分LLM，随意连接和离开。为了做到这一点，我们开发了特殊的容错推理算法和负载平衡协议，这些算法和协议可以自动分配设备，以最大限度地提高系统的总吞吐量。我们在PETALS1中展示了这些算法，PETALS1是一个去中心化的系统，在互联网上运行Llama 2（70B）和BLOOM（176B），比卸载交互生成快10倍。我们评估了我们的系统在模拟条件和横跨两大洲的真实世界设置中的性能。

1 引言

2 背景：高效训练和推理

3 方法

4 实验

5 结论

在本文中，我们介绍了一种新的容错算法，用于推理大型语言模型。最重要的是，我们引入了一种去中心化系统，用于在通过互联网连接的分布式不可靠设备上运行LLM，它显著优于在消费级硬件上运行推理的其他方法。我们证明了所提出的系统可以扩展到具有数千亿可训练参数的最大公共语言模型。
虽然我们的工作侧重于技术方面，但重要的是要考虑我们方法的局限性，例如外部同行处理的数据的隐私，以及使LLM更容易访问的更广泛影响。我们在附录H中讨论了这些问题，并概述了未来工作的方向。

猜你喜欢

转载自blog.csdn.net/c_cpp_csharp/article/details/135064268

Distributed Inference and Fine-tuning of Large Language Models Over The Internet

Fine-Tuning Language Models from Human Preferences

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-into Attention论文解读

Challenges and Applications of Large Language Models

Large Language Models in Finance: A Survey

A Survey of Large Language Models Attribution

Paper：《Instruction Tuning for Large Language Models: A Survey—大型语言模型的指令调优的综述》翻译与解读

【论文精读】Emergent Abilities of Large Language Models

论文阅读 A Survey of Large Language Models 3

论文阅读 A Survey of Large Language Models 2

论文阅读 A Survey of Large Language Models 1

Are Emergent Abilities of Large Language Models a Mirage?

Enabling Large Language Models to Generate Text with Citations

A Survey on Model Compression for Large Language Models

Augmented Large Language Models with Parametric Knowledge Guiding

Recommender Systems in the Era of Large Language Models (LLMs)

Trends in Integration of Knowledge and Large Language Models

TASKBENCH: BENCHMARKING LARGE LANGUAGE MODELS FOR TASK AUTOMATION

A Survey on Multimodal Large Language Models for Autonomous Driving

论文解读：Large Language Models as Analogical Reasoners

A Survey of Text Watermarking in the Era of Large Language Models

HaluEval： A Large-Scale Hallucination Evaluation Benchmark for Large Language Models

Shortcut Learning of Large Language Models in Natural Language Understanding: A Survey，2020

论文分享|《Universal Language Model Fine-tuning for Text Classificatio》

《Universal Language Model Fine-tuning for Text Classification》翻译

Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-Tuning

chain of thought prompting elicits reasoning in large language models

论文阅读：chain of thought Prompting elicits reasoning in large language models

大模型 LLM 综述, A Survey of Large Language Models

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

WebSocket、HTTP 与 TCP

private,public,protected的区别

Python用了这么多年，总结出超实用的功能和特点

dgwp笔记

ModuleNotFoundError: No module named 'gdbm'

数组的去重方法

Ternsorflow 学习：005-MNIST 实现模型

SpringBoot 2 源码学习笔记（二）

jaxws-spring 搭建Web Services笔记

读取properties文件并获取属性值

每日归档

更多

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)