WizardKM: capacitando grandes modelos de linguagem para seguir instruções complexas

News 2023-06-12 11:01:16 views: null

WizardKM: capacitando grandes modelos de linguagem para seguir instruções complexas

Introdução
referência

Introdução

O autor mostra que os dados de instrução na comunidade nlp atual são relativamente simples, e a maioria deles são tarefas de resumo e tradução, mas em cenários reais, as pessoas têm várias necessidades, o que limita a versatilidade do modelo.
O autor mencionou que, se a qualidade desses dados de qa rotulados por humanos for relativamente alta, liberará muito bem o desempenho do modelo, mas há alguns problemas na obtenção dos dados agora:

Rotular esse tipo de dados é muito demorado e caro.
Devido ao profissionalismo limitado do rotulador, é difícil obter dados de alta qualidade.

Com base nos problemas acima, o autor propõe um método que pode construir uma grande quantidade de dados de alta qualidade em um curto período de tempo.
insira a descrição da imagem aqui
Conforme mostrado na figura acima, o autor chama esse método de Evol-Instruct.Partindo de um 1+1 igual a quê, o autor expande os dados de duas direções: a direção da profundidade e a direção da largura. Em seguida, envie a pergunta para o ChatGPT para obter o par de dados qa e, em seguida, filtre os dados.

Para verificar a eficácia desse método, os dados gerados pelo método acima foram ajustados pelo Llama7B, chamado WizardLM, e comparados com Alpaca e Vicunha. O autor gera 250 mil dados por meio do método Evol-Instrcut por meio dos dados de inicialização do Alpaca 175. Por uma questão de justiça, o autor amostra 70 mil dados nesses dados para comparação.

Descobertas de experimentos:

Os dados gerados pelo Evol-instruct superam os do ShareGPT.
Sob instruções de teste complexas, os anotadores preferem a saída do WizardLM à do ChatGPT.

referência

https://arxiv.org/pdf/2304.12244.pdf

Acho que você gosta

Origin blog.csdn.net/qq_18555105/article/details/130389959

WizardKM: capacitando grandes modelos de linguagem para seguir instruções complexas

Instruct2Act: Mapeando instruções multimodais para ações de robôs usando grandes modelos de linguagem

Habilidades de raciocínio para grandes modelos de linguagem

[Ajuste fino de instruções da série LLM] Resumindo, "Aviso" para ajuste fino de instruções de modelos grandes

Lições aprendidas com GPT e modelos de linguagem grandes

A visão geral mais abrangente de ajuste de instrução para grandes modelos de linguagem: de conjuntos de dados a análises técnicas

Análise VisProg: resolvendo tarefas visuais complexas com base em instruções de linguagem natural

Grandes modelos de linguagem em criptomoedas

Grandes modelos de linguagem, parte 1: BERT

Video-LLaMA: Fornecendo recursos visuais e auditivos para grandes modelos de linguagem

SmoothQuant: quantização pós-treinamento precisa e eficiente para grandes modelos de linguagem

Novas ideias para ganhar dinheiro com grandes modelos de linguagem natural AIGC

Pré-treinamento contínuo de grandes modelos de linguagem

Compartilhamento de papel de aprendizado profundo (4) Rede retentiva: um sucessor do transformador para grandes modelos de linguagem

Ilusão ou Fato | HaluEval: Um Benchmark de Avaliação de Ilusão para Grandes Modelos de Linguagem

Como funcionam os modelos grandes de linguagem desconstruída popular

Você usa grandes modelos de linguagem em seu negócio?

A Apple implanta grandes modelos de linguagem localmente nos dispositivos

[PNL] LLM --- "Prompt" no ajuste fino de instruções de modelos grandes

O progresso mais rápido é jogar jogos, para não mencionar as dezenas de milhões de competições de prêmios em dinheiro na direção de grandes modelos de linguagem!

论文解读：O canto da sereia no oceano de IA: uma pesquisa sobre alucinações em grandes modelos de linguagem

Comparação de grandes modelos chineses de código aberto, suporte para atualizações

Processamento de linguagem natural: uma introdução a grandes modelos de linguagem

5 principais desafios e soluções para implementação de grandes modelos em nível empresarial

【Modelo grande de IA de código aberto】WizardCoder: Capacitando modelos de linguagem grande de código com Evol-Instruct

Como construir a base de conhecimento de dados básicos subjacente para respostas inteligentes a perguntas de modelos de linguagem de grandes empresas?

ACL 2023: Segurança e confiabilidade de modelos grandes, consultas lógicas complexas, análise de sentimento, etc. | Prévia em 21 de setembro

Instruções básicas SQL e algumas instruções de consulta SQL complexas

Grandes eventos de séries de modelos agora abertos para inscrições para palestrantes de todo o mundo

[Processamento de linguagem natural] Ajuste fino eficiente de modelos grandes: casos de uso de PEFT

Recomendado

Clasificación

Diario

Más

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(0)

2024-06-03(0)

2024-06-02(0)

2024-06-01(0)

2024-05-31(0)

2024-05-30(0)

2024-05-29(0)