基于peft 微调 LLaMa模型 - 代码天地

基于peft 微调 LLaMa模型

企业开发 2023-07-23 00:27:50 阅读次数: 0

1、模型和数据准备

使用的大模型：https://huggingface.co/decapoda-research/llama-7b-hf，已经是float16的模型。

微调数据集：https://github.com/LC1332/Chinese-alpaca-lora/blob/main/data/trans_chinese_alpaca_data.json

微调的代码已上传到github：https://github.com/jiangxinyang227/LLM-tuning/tree/master/llama_tuning

2、微调技巧

1）lora微调。float16的模型刚刚好存放在16G的GPU上，没有太多显存用于存放梯度、优化器等参数，因此在这里使用lora微调部分参数。

2）混合精度训练，因为llama-7b有27g，想在单张V100上加载就需要转换成float16才行，而lora参数用的是float32，需要使用混合精度训练。同时混合精度训练也会有所加速。

3）梯度累积，单张gpu在存放完模型参数，lora参数、梯度、优化器等参数之后只剩下很少的显存给到输入输出等中间变量，经测试单张V100的极限大致是batch size=1，sequence length=200，只能使用梯度累积实现mini-batch训练。

4）当有多张卡时，可

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131724933

基于peft 微调 LLaMa模型

基于医疗领域数据微调LLaMA——ChatDoctor模型

基于中文金融知识的 LLaMA 系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

PEFT 微调

大语言模型微调和PEFT高效微调

大模型高效微调-PEFT框架介绍

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

基于LLaMA-2进行微调的FreeWilly2开源语言模型

微调语言大模型选LoRA还是全参数？基于LLaMA 2深度分析

微调 Llama-2 7B 模型以生成 Python 代码有关如何使用 PEFT、QLoRa 和 Huggingface 实用程序微调新 Llama-2 的演示

[NLP]理解大型语言模型高效微调(PEFT)

哈工大团队开源医学智能问诊大模型 | 华佗: 基于中文医学知识的LLaMa指令微调模型

微调模型_基于keras框架

ChatDoctor：一个基于微调LLaMA模型用于医学领域的医学聊天机器人

Peft库使用技巧（一）：合并基座模型与Lora模型【使用Peft库微调基座模型（比如LLaMA-7B）后会得到Lora参数模块，将基座模型与Lora参数合并后才能得到完整的微调后的大模型】

LLM-项目详解-Chinese-LLaMA-AIpaca（一）：LLM+LoRa微调加速技术原理及基于PEFT的动手实践：一些思考和mt0-large+lora完整案例

大模型之Bloom&LLAMA----SFT(模型微调)

使用peft的lora，微调MAE

LLaMA模型微调版本：斯坦福 Alpaca 详解

LLaMA模型微调版本 Vicuna 和 Stable Vicuna 解读

训练自己的Llama 2！大模型微调技术介绍

让天下没有难Tuning的大模型-PEFT（参数效率微调）技术简介

【自然语言处理】大模型高效微调：PEFT 使用案例

PEFT: 在低资源硬件上对十亿规模模型进行参数高效微调

如何使用LoRA和PEFT微调 Mistral 7B 模型

模型微调

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

大模型的实践应用10-大模型领域知识与参数高效微调(PEFT)技术的详解，并利用PEFT训练自己的大模型

[NLP]LLM高效微调(PEFT)--LoRA

使用 DPO 微调 Llama 2

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)