Registro de pit de passo de ajuste fino de vários cartões ChatGLM - Code World

Registro de pit de passo de ajuste fino de vários cartões ChatGLM

Enterprise 2023-06-21 20:33:59 views: null

O sujeito recentemente tentou usar o LoRA para ajustar o ChatGLM em seus próprios dados. Embora existam muitos códigos relacionados ao LoRA no GitHub, o sujeito ainda encontrou muitos problemas durante o processo de implementação. Agora vamos resolver os problemas encontrados para sua referência O código relacionado também será organizado no GitHub.

1. Erro: esperava que todos os tensores estivessem no mesmo dispositivo, mas encontrou pelo menos dois dispositivos, cuda:1 e cuda:0!

Este problema será encontrado ao usar o treinamento multicartão de velocidade profunda. O motivo é que, devido a uma atualização do ChatGLM, os parâmetros do modelo antigo baixado offline e a nova versão carregada pelo AutoModel entrarão em conflito.

Você pode usar o arquivo config.json no modelo para identificar se o ChatGLM baixado para o local é uma versão antiga ou uma nova versão.

O vocab_size da versão antiga do ChatGLM é 150528:

{
  "_name_or_path": "THUDM/chatglm-6b",
  "architectures": [
    "ChatGLMModel"
  ],
  "auto_map": {
    "AutoConfig": "configuration_chatglm.ChatGLMConfig",
    "AutoModel": "modeling_chatglm.ChatGLMForConditionalGeneration",
    "AutoModelForSeq2SeqLM": "modeling_chatglm.ChatGLMForConditionalGeneration"
  },
  "bos_token_id": 150004,
  "eos_token_id": 150005,
  "pad_token_id": 20003,
  "hidden_size": 4096,
  &

Acho que você gosta

Origin blog.csdn.net/u013250861/article/details/131262206

Registro de pit de passo de ajuste fino de vários cartões ChatGLM

Ajuste fino de LoRA

Implementação de ajuste fino com base no ChatGLM

[LLM] modelo de linguagem ajuste fino ajuste fino

Ajuste fino do diálogo de várias rodadas do ChatGLM - geração automática (rotulagem) de dados de treinamento de diálogo de várias rodadas

(2) Implantação do modelo ChatGLM-6B e tutorial detalhado de ajuste fino

Prática eficiente de ajuste fino dos parâmetros LLaMA, ChatGLM, BLOOM

Resumo prático de ajuste fino do modelo grande ChatGLM-6B

[Ajuste fino de instruções da série LLM] Resumindo, "Aviso" para ajuste fino de instruções de modelos grandes

[Prática de modelo grande] Modelo de ajuste fino de entrada-saída ChatGLM3 (6)

Ajuste fino de instrução de LLMs Ajuste fino de instrução

Prática de ajuste fino ChatGLM2-6B baseada em P-Tuning v2 | Equipe técnica JD Cloud

LLM-Project Detailed-InstructKGC (1): Ajuste fino do ChatGLM com Lora【Extração de trigêmeos orientada por instruções】

Ajuste fino de sd e ajuste fino de lora em difusores

Princípio de ajuste fino de modelo grande de PNL

Chatglm2-6b faz ajuste fino de LORA no P40 | Equipe técnica da JD Cloud

Ajuste fino do modelo de detecção de mm

Ajuste fino de parámetros completos de parámetros completos y ajuste fino de rango bajo de LoRA

Aprendizado de migração e ajuste fino para classificação de cães e gatos

[PNL] LLM --- "Prompt" no ajuste fino de instruções de modelos grandes

Botão de ajuste fino para componentes GTK

LLM de ajuste fino com uma única GPU

LLM: ajuste fino do modelo de linguagem pré-treinado

Aprendizado de transferência, ajuste fino e pré-treinamento

modelo de pré-treinamento resnet e ajuste fino

P-Tuning v2: otimização imediata igual ao desempenho de ajuste fino

Digite Reagir passo sobre as regras de caixa de pit são necessários = true

registro fino de nuvem de pontos matlab (3) - ICP aparado

Vários métodos de ajuste de volume no Android

【LLM】Ajuste rápido prática de ajuste fino de modelo grande

Recomendado

Clasificación

Diario

Más

2024-05-08(19)

2024-05-07(34)

2024-05-06(4)

2024-05-05(0)

2024-05-04(19)

2024-05-03(7)

2024-05-02(0)

2024-05-01(4)

2024-04-30(34)

2024-04-29(5)