【ChatGLM】大模型之 ChatGLM 微调 - 代码天地

【ChatGLM】大模型之 ChatGLM 微调

企业开发 2023-09-30 02:08:32 阅读次数: 0

目录

1. 微调方法

2. 全量参数微调

1. 微调方法

全参数微调

对模型全量参数进行训练。

P-tunning v2

前缀微调，在模型每一层都增加前缀，只训练这部分的参数，训练量明显小于全量微调。

LoRA

基于矩阵分解的微调，假设原权重喂 W_0，我们新增一个和 W_0 一摸一样形状的矩阵 W_delta，并且对 W_delta 分解为 A 和 B，在训练过程中只训练 A 和 B 的参数，最后的权重 W = W_0 + W_delta

2. 全量参数微调

代码下载见：

扫描二维码关注公众号，回复： 16869484 查看本文章

【ChatGLM】大模型之 ChatGLM 部署

### full parameter finetuning ### (need enough GPU, at least 4 A100) 
cd ptuning
sh ds_train_finetune.sh

3. P-tuning v2

代码下载见：

【ChatGLM】大模型之 ChatGLM 部署

### p-tuning v2 ###
# dataset
cd ptuning
wget https://cloud.tsinghua.edu.cn/seafhttp/files/802c9912-2742-47c9-a0d3-18ee08d83438/AdvertiseGen.tar.gz
tar -xvf AdvertiseGen.tar.gz

# modify model path and other parameter
sh train.sh

4. LoRA

### LoRA ###
git clone https://github.com/yuanzhoulvpi2017/zero_nlp.git
git clone https://huggingface.co/yuanzhoulvpi/chatglm6b-dddd

cd zero_nlp/simple_thu_chatglm6b
# execute jupyter notebook
# load model and lora need 24G, training need 17G
code02_训练模型全部流程.ipynb

执行 Juputer Notebook 后

猜你喜欢

转载自blog.csdn.net/u014147522/article/details/132166642

【ChatGLM】大模型之 ChatGLM 微调

大模型lora微调-chatglm2

基于ChatGLM的微调实现

【大模型实践】ChatGLM3微调对话模型（五）

ChatGLM-6B大模型微调实战总结

ChatGLM LoRA微调实战方案

【ChatGLM】大模型之 ChatGLM 部署

ChatGLM

基于ChatGLM-Med与HuaTuo的微调部署

ChatGLM-6B微调与部署

ChatGLM多卡微调踩坑记录

【AIGC】Chatglm2-lora微调

【实战】Chatglm微调指引和部署（MNN）

LLaMA, ChatGLM, BLOOM的参数高效微调实践

Chatglm2使用及微调教程

ChatGLM服务器部署微调（二）

ChatGLM服务器部署微调（一）

ChatGLM2-6B，部署及微调

【大模型实践】ChatGLM3微调输入-输出模型（六）

使用 Amazon SageMaker 微调和部署 ChatGLM 模型

【AWS系列】使用 Amazon SageMaker 微调和部署 ChatGLM 模型

ChatGLM3-6B模型介绍及微调

Cursor太强了，从零开始写ChatGLM大模型的微调代码

大模型ChatGLM Lora微调的参数详探- 多卡版本

【报告】从GLM-130B到ChatGLM：大模型预训练与微调学习记录

自学大语言模型之ChatGLM(一)

ChatGLM2 大模型微调过程中遇到的一些坑及解决方法(更新中)

学习实践ChatGLM-6B（部署+运行+微调）

ChatGLM-6B 部署与 P-Tuning 微调实战

ChatGLM-6B-PT指定gpu微调

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)