【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践 - 代码天地

【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

业界资讯 2023-08-12 18:25:40 阅读次数: 0

1. 开源基座模型对比

大语言模型的训练分为两个阶段：（1）在海量文本语料上的无监督预训练，学习通用的语义表示和世界知识。（2）在小规模数据上，进行指令微调和基于人类反馈的强化学习，更好地对齐最终任务和人类偏好。LIMA[1]证明了LLM的几乎所有知识都是在预训练过程中学习到的，只需要有限的指令微调数据就可以生成高质量的回复。因此，基座模型的性能是至关重要的，如果基座模型的性能不够好，指令微调和强化学习也难以取得很好的效果。

目前，主流的开源大语言模型主要有三个：LLaMA、ChatGLM和BLOOM。基于这三个开源模型，业界进行了指令微调或强化学习，衍生出了许多不同的大模型。下面从训练数据、tokenizer和模型结构上对这三个大语言模型进行比较。

模型	训练数据	训练数据量	模型参数量	词表大小
LLaMA	以英语为主的拉丁语系，不包含中日韩文	1T/1.4T tokens	7B、13B、33B、65B	32000
ChatGLM-6B	中英双语，中英文比例为1:1	1T tokens	6B	130528
Bloom	46种自然语言和13种编程语言，包含中文	350B tokens	560M、1.1B、1.7B、3B、7.1B、176B	250880

模型

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/132152100

【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

LLaMA, ChatGLM, BLOOM的参数高效微调实践

万字长文详述ClickHouse的探索与实践

《基于 qiankun 的微前端最佳实践（万字长文） - 从 0 到 1 篇》

从原理到实践，万字长文解析矩阵分解推荐算法

【敏捷转型，效能提升】万字长文敏捷转型实践系列分享

【万字长文】前端性能优化实践 | 京东云技术团队

LLaMA ChatGLM2 BLOOM模型技术分析对比

干货 | 近万字长文详述携程大规模应用RN的工程化实践

5万字长文:Stream和Lambda表达式最佳实践-附PDF下载

知乎基于 Apache Doris 的 DMP 平台架构建设实践｜万字长文详解

万字长文详述ClickHouse在京喜达实时数据的探索与实践 | 京东云技术团队

Python 散点图密度图趋势分析分类散点图双变量映射各参数详解全集（万字长文）

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+

【ChatGLM】大模型之 ChatGLM 微调

基于ChatGLM的微调实现

万字长文：手把手教你实现一套高效的IM长连接自适应心跳保活机制

基于AWS的云架构设计最佳实践——万字长文：云架构设计原则|附PDF下载

万字长文剖析ChatGPT

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

ChatGLM LoRA微调实战方案

从0到1基于ChatGLM-6B使用LoRA进行参数高效微调

ChatGLM

学习实践ChatGLM-6B（部署+运行+微调）

【大模型实践】ChatGLM3微调对话模型（五）

万字长文深度解析Python装饰器

万字长文：云架构设计原则

万字长文深度解析 Polkadot 架构

《GAN万字长文综述》的读文章笔记

万字长文，被低估的以太坊

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)