Truco de construcción de muestra de ajuste fino de modelo grande - Code World

Truco de construcción de muestra de ajuste fino de modelo grande

Enterprise 2023-07-23 05:21:04 views: null

Entrevistador: ¿Cómo organiza el ajuste fino de modelos grandes las muestras de entrenamiento?

Usted: una pregunta y una respuesta para el entrenamiento de modelos grandes, una instrucción y una salida. Las preguntas y las instrucciones se pueden usar como entrada rápida y las respuestas como salida. La parte del cálculo de la pérdida debe bloquear el token de la almohadilla.

Entrevistador: ¿Cómo organizar muestras de capacitación en múltiples rondas de diálogo?

Usted: Suponiendo que las rondas múltiples son Q1A1/Q2A2/Q3A3, entonces se puede convertir en tres muestras de entrenamiento de Q1—>A1, Q1A1Q2->A2, Q1A1Q2A2Q3->A3.

Entrevistador: En este caso, una sesión se convierte en tres datos, y los anteriores se repiten en secuencia, ¿habrá algún problema?

Usted: la mayoría de los datos son tokens de almohadilla y la eficiencia de utilización de los datos de entrenamiento es baja. Además, habrá un problema de expansión repetida de datos.La expansión repetida de datos de entrenamiento es el número de sesiones * el número promedio de rondas, y hay partes repetidas en lo anterior, y la eficiencia del entrenamiento será baja.

Entrevistador: También te diste cuenta de eso, ¿hay alguna forma de mejorarlo?

Usted: ¿Hay alguna forma de construir una sesión como muestra de entrenamiento a la vez? (Pensando)

Entrevistador: Recordatorio, limite a la serie de modelos de solo decodificador, use las características del modelo para mejorar la forma de organización de la muestra.

Para este problema, pensemos en las características del modelo de solo decodificador. El primer punto es que su forma de atención es casual. Una comprensión simple de casual es una matriz triangular. Un solo token solo puede ver la información que está arriba.

como muestra la imagen:

Supongo que te gusta

Origin blog.csdn.net/u013250861/article/details/131686901

Truco de construcción de muestra de ajuste fino de modelo grande

Modelo grande multimodal (base de modelo grande, ajuste fino, preentrenamiento multimodal de comprensión de video)

Lamini: marco de ajuste fino del modelo de lenguaje grande

Principio de ajuste fino del modelo grande de PNL

【LLM】Práctica de ajuste fino de modelo grande de ajuste rápido

[LLM] modelo de linguagem ajuste fino ajuste fino

Tecnología de ajuste fino de modelo de lenguaje grande de inteligencia artificial: SFT, LoRA, congelar métodos de ajuste fino supervisados

Resumen práctico de ajuste fino del modelo grande ChatGLM-6B

Ajuste fino de LoRA

[LLM] conjunto de datos de ajuste fino de instrucción de construcción de autoinstrucción

El séptimo modelo de lenguaje grande: SFT de ajuste fino de GPU única Llama-2

Ajuste fino de un modelo de PNL preentrenado

Ajuste fino del modelo de clasificación de imágenes en Hugging Face

"Ajuste fino del modelo grande" usando DDP para realizar la guía paralela multitarjeta de una sola máquina del programa

Ajuste fino del modelo basado en T5 e introducción de datos correspondiente

Ajuste fino del modelo de difusión estable en las CPU Intel

Basado en chino-roberta-wwm-ext entrenamiento de ajuste fino 6 modelo de análisis de sentimiento de clasificación

Modelo de dominio grande: truco de entrenamiento y pensamiento de aterrizaje

[Ciencia de datos] Keras [Keras, datos, arquitectura de modelo, preprocesamiento, revisión de modelo, compilación de modelo, entrenamiento de modelo, evaluación del rendimiento del modelo, predicción, guardar/cargar modelo, ajuste fino del modelo]

Entrene su propio modelo de ajuste fino de ChatGPT-OpenAI

Pytorch fijo parámetros-modelo de preentrenamiento y ajuste fino

Formato de dados de ajuste fino de comando

Texto largo de 10.000 palabras: una revisión del ajuste de instrucciones del modelo de lenguaje grande

El nuevo trabajo de Fudan Qiu Xipeng: ajuste fino de una sola máquina de un modelo grande con 65 mil millones de parámetros, expertos de la industria: es de gran importancia para la popularización de modelos grandes...

Construcción de una base de conocimiento local basada en un modelo grande

Descripción general de los principios de la tecnología de ajuste fino eficiente para parámetros de modelos grandes (2): BitFit, ajuste de prefijo, ajuste rápido

LaVIN: ajuste fino de instrucción eficiente para modelos de diálogo multimodal

¡Entrena a tu propia Llama 2! Introducción a la tecnología de ajuste fino de modelos grandes

En la descripción general del ajuste fino eficiente de modelos grandes: Ajuste de adaptador, AdaMix, PET, Ajuste de prefijo, Ajuste rápido, Ajuste de P, Ajuste de P v2

Ajuste fino de LLM con una sola GPU

Recomendado

Clasificación

Diario

Más

2024-05-15(5)

2024-05-14(10)

2024-05-13(7)

2024-05-12(22)

2024-05-11(31)

2024-05-10(32)

2024-05-09(31)

2024-05-08(18)

2024-05-07(35)

2024-05-06(4)