alpaca-lora微调

企业开发 2023-06-05 12:09:54 阅读次数: 0

alpaca-lora项目地址：https://github.com/tloen/alpaca-lora

微调

1、将项目下载到本地

git clone https://github.com/tloen/alpaca-lora.git

2、配置环境
先安装torch

pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

安装其他包

pip install -r requirements.txt

由于微调时间较长，这里直接后台运行。

nohup python -u finetune.py \
    --base_model 'decapoda-research/llama-7b-hf' \
    --data_path 'yahma/alpaca-cleaned' \
    --output_dir './lora-alpaca' \
    >> log.out 2>&1 &

预训练模型：decapoda-research/llama-7b-hf 会自动下载。共计33个405M的bin文件，大约占用约14G内存。
在这里插入图片描述
微调数据：https://huggingface.co/datasets/yahma/alpaca-cleaned
该数据基于斯坦福alpca数据进行了清洗。

微调过程预计需要60个小时，占用显存约9个G。

推理

设置generate.py文件，将share=True，便于公网访问。

python generate.py \
    --load_8bit \
    --base_model '/data/sim_chatgpt/llama-7b-hf/models--decapoda-research--llama-7b-hf/snapshots/5f98eefcc80e437ef68d457ad7bf167c2c6a1348/' \
    --lora_weights 'tloen/alpaca-lora-7b'

如果报错，不能创建链接，降低下gradio版本即可，如：pip install gradio==3.13

效果如下，显存占用约8个G
在这里插入图片描述

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/dzysunshine/article/details/130871404

alpaca-lora微调

学习实践-Alpaca-Lora (羊驼-Lora)（部署+运行+微调-训练自己的数据集）

类ChatGPT模型LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

Llama-1｜Alpaca-LoRA 微调模型下载以及安装推理教程

足够惊艳，使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调，效果比肩斯坦福羊驼

【深度学习，NLP，LM】Alpaca-Lora ，Colab上部署与调用

GPT大语言模型Alpaca-lora本地化部署实践【大语言模型实践一】 | 京东云技术团队

LoRA微调

diffusers中的dreambooth的微调和lora微调

diffusers中sd的微调和lora微调

ChatGLM LoRA微调实战方案

使用peft的lora，微调MAE

微调大模型工具-LoRA

LLaMA模型微调版本：斯坦福 Alpaca 详解

在自定义数据集上微调Alpaca和LLaMA

Full-Parameter全参数微调与LoRA低秩微调

【AIGC】Chatglm2-lora微调

LoRA微调来自huggingface官方抱抱脸

使用Dreambooth LoRA微调SDXL 0.9

[NLP]LLM高效微调(PEFT)--LoRA

基于LoRA进行Stable Diffusion的微调

大模型lora微调-chatglm2

大模型LLM的微调技术：LoRA

使用 Docker 和 Alpaca LoRA 对 LLaMA 65B 大模型进行 Fine-Tune

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora（部分）

类ChatGPT项目的部署与微调(上)：从LLaMA到Alpaca、BELLE

一文读懂：LoRA实现大模型LLM微调

LORA大模型加速微调和训练算法

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)