ChatGLM多卡微调踩坑记录 - 代码天地

ChatGLM多卡微调踩坑记录

企业开发 2023-06-21 16:21:20 阅读次数: 0

题主近期尝试使用LoRA在自有数据上微调ChatGLM，尽管GitHub上已有很多LoRA相关代码，但实现过程中题主还是遇到了很多问题，现将遇到的问题整理出来供大家参考，实现的相关代码也会整理到GitHub.

1. Error: Expected all tensors to be on the same device, but found at least two devices, cuda:1 and cuda:0!

使用deepspeed多卡训练时会遇到这个问题，原因是由于ChatGLM进行了一次更新，使用离线下载的老版模型参数和AutoModel加载的新版配置会发生冲突。

可以通过模型中的config.json文件鉴别下载到本地的ChatGLM是老版还是新版。

老版的ChatGLM的vocab_size为150528:

{
  "_name_or_path": "THUDM/chatglm-6b",
  "architectures": [
    "ChatGLMModel"
  ],
  "auto_map": {
    "AutoConfig": "configuration_chatglm.ChatGLMConfig",
    "AutoModel": "modeling_chatglm.ChatGLMForConditionalGeneration",
    "AutoModelForSeq2SeqLM": "modeling_chatglm.ChatGLMForConditionalGeneration"
  },
  "bos_token_id": 150004,
  "eos_token_id": 150005,
  "pad_token_id": 20003,
  "hidden_size": 4096,
  &

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131262206

ChatGLM多卡微调踩坑记录

Ubuntu部署ChatGLM2-6B踩坑记录

大模型ChatGLM Lora微调的参数详探- 多卡版本

LLMs之ChatGLM2：ChatGLM-Finetuning(基于DeepSpeed)的简介、使用方法(四种微调方法(Freeze方法/Lora方法/P-Tuning方法/全量参数)+单卡/多卡训

Mybatis plus 多租户方案踩坑记录

基于ChatGLM的微调实现

canvas 踩坑记录

Linux 踩坑记录

ReactNative踩坑记录

QT踩坑记录

OrientDB 踩坑记录

Echarts踩坑记录

icon踩坑记录

duilib踩坑记录

vue踩坑记录

node踩坑记录

weex踩坑记录

Python踩坑记录

JPA踩坑记录

pinpoint踩坑记录

Jenkins 踩坑记录

AngularJS踩坑记录

ReactNative 踩坑记录

Lodash踩坑记录

Kubernetes踩坑记录

react踩坑记录

iview踩坑记录

mybatis 踩坑记录

MongoDB踩坑记录

kotlin踩坑记录

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)