ChatGLM2 大模型微调过程中遇到的一些坑及解决方法(更新中) - 代码天地

ChatGLM2 大模型微调过程中遇到的一些坑及解决方法(更新中)

企业开发 2023-12-18 04:00:48 阅读次数: 0

1. 模型下载问题

OSError: We couldn't connect to 'https://huggingface.co' to load this file, couldn't find it in the cached files and it looks like bert-base-uncased is not the path to a directory containing a file named config.json.
Checkout your internet connection or see how to run the library in offline mode at 'https://huggingface.co/docs/transformers/installation#offline-mode'.

模型默认是从huggingface上下载的，需要科学上网。挂上梯子后即可下载，注意模型都帮你较大，会消耗很多流量。

2. 模型保存地址

下载后，会占用C盘大量空间，对于重复下载的模型文件，可以进行删除。以下是其存储路径。

Windows系统

C:\Users\你的用户名\.cache\huggingface

Linux系统

       ~/.cache/huggingface/

3. 模型无法量化

默认情况下，模型以 FP16 精度加载，运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限，可以尝试以量化方式加载模型，使用方法如下：

model = AutoModel.from_pretrained("THUDM/chatglm2-6b-int4",trust_remote_code=True).cuda()
peft_config = LoraConfig(
    task_type=TaskType.CAUSAL_LM, inference_mode=False,
    r=8,
    lora_alpha=32, lora_dropout=0.1,
)

model = get_peft_model(model, peft_config)

出现以下错误：

ValueError: Target module QuantizedLinear() is not supported. Currently, only `torch.nn.Linear` and `Conv1D` are supported.

原因：以int4量化加载的模型是不支持进行微调的。

4. 分词器

以chatglm为例，有“chatglm2-6b” "chatglm2-6b-int8" "chatglm2-6b-int4" 三个版本，但是分词器tokenizer是共用的，不受模型量化加载方式改变。所以我们在加载tokenizer的时候，只需设置就可以了：

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True)

5. int-8量化的模型无法下载

在chatglm第一版里面，是提供int4 int8和fp16，三个版本的文件的，但是在chatglm2里，可以看到只给了fp16和int4两个版本的文件。

猜你喜欢

转载自blog.csdn.net/tortorish/article/details/134064424

ChatGLM2 大模型微调过程中遇到的一些坑及解决方法(更新中)

大模型lora微调-chatglm2

Chatglm2使用及微调教程

Flask在线部署ChatGLM2大模型

LLaMA ChatGLM2 BLOOM模型技术分析对比

【笔记】解决学习Chatglm2 时遇到的 CUDA Error: no kernel image is available for execution on the device 问题

AI技术快讯：清华开源ChatGLM2双语对话语言模型

LLMs之ChatGLM2：基于ChatGLM Efficient Tuning(微调工具包)实现对ChatGLM2进行LoRA微调并进行推理测试图文教程之详细攻略

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(一)

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(二)

手把收带你调用大模型+附上清华大学云盘：chatglm2位置

深度学习实战54-基于ChatGLM2大模型构建智能自助用药问答系统与药物智能管理实战的应用

ChatGLM2发布！中文榜单开源模型排名第一！8-32k上下文，推理提速42%

LLMs之ChatGLM2：ChatGLM-Finetuning之源码解读(train.py文件)—解析命令→加载数据→模型训练(四种方式微调+DeepSpeed封装数据并行)+模型保存(定期输出lo

LLMs之ChatGLM2：ChatGLM-Finetuning(基于DeepSpeed)的简介、使用方法(四种微调方法(Freeze方法/Lora方法/P-Tuning方法/全量参数)+单卡/多卡训

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+

ChatGLM2 源码解析：`ChatGLMModel`

ChatGLM2 源码解析：`GLMTransformer`

ChatGLM2 源码解析：`GLMBlock`

ChatGLM2 源码解析：`MLP`

ChatGLM2本地部署的实战方案

2023年的深度学习入门指南(23) - ChatGLM2

ChatGLM2 源码解析：`ChatGLMForConditionalGeneration.forward`

【NLP】训练chatglm2的评价指标BLEU，ROUGE

LLMs之ChatGLM2：ChatGLM2-6B本地部署之单机推理(API/CLI/GUI)、低成本部署(GPU量化部署/CPU及其量化部署/Mac部署/多卡部署)、有限资源下高效微调(全参/P-t

andriod2-android开发过程中遇到的一些坑

使用Python过程中遇到的一些坑及其解决方法（持续更新）

基于ChatGLM2和langchain的本地知识库问答的实战方案

重磅！清华ChatGLM2开源！中文榜居首，碾压GPT-4！

ChatGLM2发布，位居C-Eval榜首!

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)