Azure Machine Learning: Introducción al proyecto Tips

Los modelos GPT-3, GPT-3.5 y GPT-4 de OpenAI funcionan según indicaciones de texto ingresadas por el usuario. La construcción eficaz de señales es una habilidad clave para utilizar estos modelos e implica configurar los pesos del modelo para realizar tareas específicas. Esta no es sólo una operación técnica, sino más bien un arte que requiere experiencia e intuición. Este artículo tiene como objetivo presentar conceptos y técnicas de sugerencias que se aplican a todos los modelos GPT.

Siga a TechLead y comparta conocimientos multidimensionales sobre la IA. El autor tiene más de 10 años de arquitectura de servicios de Internet, experiencia en investigación y desarrollo de productos de IA y experiencia en gestión de equipos. Tiene una maestría de la Universidad Tongji en la Universidad de Fudan, es miembro del Laboratorio de Inteligencia de Robots de Fudan y es un arquitecto senior certificado por Alibaba Cloud. , un profesional de gestión de proyectos e investigación y desarrollo de productos de IA con ingresos de cientos de millones.

archivo

Consejos sobre conceptos básicos de ingeniería.

Esta sección presenta los conceptos y elementos básicos de los consejos de GPT.

Las indicaciones de texto son la forma en que los usuarios interactúan con los modelos GPT. Como todos los modelos de lenguaje generativo, el modelo GPT intenta generar la siguiente secuencia de palabras que probablemente sigue al texto anterior. Es como si estuviéramos diciendo "¿ Qué es lo primero que te viene a la mente cuando digo <prompt>?" . El siguiente ejemplo demuestra este comportamiento. Dado el comienzo de un contenido famoso, el modelo es capaz de continuar el texto con precisión.

Inmediato Terminación
Hace 87 años, nuestro Nuestros antepasados ​​crearon en este continente una nueva nación, concebida en libertad y dedicada al credo de que todos los hombres son creados iguales. […]
"Llámame Ismael." “Hace unos años (no importa la época exacta) tenía muy poco dinero en mi billetera y nada particularmente atractivo en tierra, así que quería salir a navegar y ver las partes del mundo que estaban cubiertas por agua.” [ …]

Es útil recordar este comportamiento básico al desarrollar indicaciones más complejas. Independientemente de la sugerencia proporcionada, el modelo simplemente responde utilizando lo que determina que es el escenario más probable (según los datos y objetivos de entrenamiento). Si se hace una pregunta en el mensaje, el modelo no sigue una ruta de código de "Preguntas y respuestas" separada, sino que parece responder la pregunta porque la respuesta es la respuesta más probable dada la pregunta de entrada.

Componente rápido

Cuando se utiliza la API de finalización y no hay distinción entre las diferentes partes del mensaje, aún puede ser útil para el aprendizaje y la discusión identificar los componentes subyacentes del mensaje. Cuando se utiliza la [API de finalización de chat], las diferentes partes del mensaje se envían a la API como una serie de diccionarios con roles asociados (sistema, usuario y asistente). Esta guía se centra de manera más general en cómo considerar construcciones de sugerencias, en lugar de proporcionar orientación prescriptiva específica para una API.

También es importante comprender que, si bien puede haber otras formas efectivas de analizar las señales, el objetivo de esta descomposición es proporcionar una forma relativamente sencilla de comprender la construcción de las señales. Cuando se utiliza la API de finalización, todos los componentes son opcionales, pero al menos un componente debe estar presente y la mayoría de las sugerencias contienen varios componentes. También puede haber algunas áreas grises entre los componentes. El orden que se muestra a continuación corresponde aproximadamente a cómo se utiliza cada componente (de mayor a menor).

Instrucciones

Las directivas son probablemente el componente rápido más utilizado. Las instrucciones son simples: dile al modelo qué hacer. Aunque simple en concepto, puede resultar complejo en la práctica. La siguiente tabla ilustra esto mostrando instrucciones simples y complejas en dos formas diferentes.

Tipo de instrucción Inmediato Terminación
instrucciones simples Escribe una introducción para el boletín semanal. Bienvenido a nuestro boletín semanal. Esta semana nos centraremos específicamente en la productividad. Compartiremos consejos y trucos sobre cómo ser más productivo en todos los aspectos de su vida. ¡Esperamos que lo disfrutes y lo compartas con tus amigos!
Instrucciones complejas Redacción de un perfil de comunicado de prensa semanal para una empresa llamada Contoso. Sería bueno mencionar la gran reunión que tuvimos la semana pasada y agradecer al equipo por su arduo trabajo durante los últimos meses. ¡Bienvenido al boletín semanal de Contoso! Tuvimos una gran reunión la semana pasada y me gustaría agradecer al equipo por su arduo trabajo durante los últimos meses. Esperamos un futuro brillante y estoy seguro de que con la dedicación y el compromiso de nuestro equipo lograremos grandes cosas. Gracias por ser parte de nuestro equipo y espero trabajar con usted en las próximas semanas y meses. Atentamente, [tu nombre].
Instrucciones complejas Escriba una introducción para el boletín semanal, que incluya lo siguiente: Mi empresa se llama contoso Saludos alegres Gracias al equipo por su arduo trabajo durante unos meses difíciles Perspectivas positivas para el próximo trimestre Firmado por SLT ¡Hola, equipo de Contoso! Quería tomarme un momento para agradecerles por todo su arduo trabajo durante los últimos meses. Han sido unos meses difíciles, pero todos os habéis mantenido unidos y habéis hecho un trabajo fantástico. Estoy realmente orgulloso de ti. De cara al próximo trimestre, me siento muy positivo. Siento que vamos a lograr grandes cosas. Gracias de nuevo, Equipo de Liderazgo Senior.

contenido principal

El contenido principal se refiere a algún tipo de texto que el modelo está procesando o convirtiendo. El contenido principal se suele utilizar con directivas. Un ejemplo sencillo es la traducción de idiomas. En el siguiente ejemplo, el texto en inglés se considera el contenido principal y "Traducir al francés:" es la directiva.

Inmediato Terminación
¿Podrías decirme cómo llegar al museo? Traducido al francés: Pouvez-vous s'il vous plaît me dire comment aller au musée?

El contenido principal también puede ser más extenso. En el siguiente ejemplo, el contenido principal es la sección introductoria de la entrada de Wikipedia sobre la complejidad del tiempo , que tiene casi 300 palabras. Para facilitar la visualización, este contenido se ha abreviado en la tabla.

Inmediato Terminación
En informática, la complejidad del tiempo se refiere a la complejidad computacional y se utiliza para describir la cantidad de tiempo de computadora requerido para ejecutar un algoritmo. La complejidad del tiempo generalmente se estima mediante […] Resumiendo el texto anterior en unas pocas oraciones: La complejidad del tiempo es una medida de cuánto tiempo tarda en ejecutarse un algoritmo. Generalmente se expresa en función del tamaño de entrada. La métrica más común es la complejidad del tiempo en el peor de los casos, que es la cantidad máxima de tiempo necesaria para una entrada de un tamaño determinado.
En informática, la complejidad del tiempo se refiere a la complejidad computacional y se utiliza para describir la cantidad de tiempo de computadora requerido para ejecutar un algoritmo. La complejidad del tiempo generalmente se estima mediante […] TL;DR` (demasiado largo para leer) La complejidad temporal de un algoritmo es la cantidad de tiempo que lleva ejecutarlo. La complejidad del tiempo generalmente se estima contando el número de operaciones básicas realizadas por un algoritmo, suponiendo que el tiempo de ejecución de cada operación básica es fijo. La complejidad del tiempo generalmente se expresa en función del tamaño de la entrada.

Los modelos GPT también pueden manejar contenido primario estructurado. En el siguiente ejemplo, el TSV de la cerveza belga (que se muestra como abreviatura en este artículo) se pasa al modelo como parte del mensaje. Es capaz de interpretar correctamente el contenido y responder preguntas sobre los datos.

Inmediato Terminación
Belgian Beer Brands Beer name Beer style color ABV Brewery "Chimay Gold: ""Doree""" trappist pale ale gold 4.80% Chimay Brewery (official trappist) "Chimay Blue: ""Grande Reserve""" trappist dark ale dark 9.00%[…] Con referencia a la tabla anterior, ¿cuántas cervezas tienen menos del 6% ABV? Hay 10 cervezas en la tabla con un ABV inferior al 6%.

Ejemplo

Las señales exitosas a menudo dependen del aprendizaje "de una sola vez" o de "pocas oportunidades". Esto se refiere a agregar uno o más ejemplos del comportamiento deseado del modelo, generalmente agregando pares de entrada y salida. Esto no es aprendizaje en el sentido de que el modelo realice cambios permanentes, sino más bien utilizar ejemplos para permitir que el modelo responda mejor solo a las necesidades de la inferencia actual. El uso de sugerencias sin ejemplos a veces se denomina aprendizaje de "tiro cero". Tenga en cuenta que cuando se utiliza la API de finalización de chat, después del mensaje inicial del sistema, normalmente se agregan algunos ejemplos de aprendizaje breves a la matriz de mensajes en forma de interacciones de muestra entre usuario y asistente.

tipo de aprendizaje Inmediato Terminación
muestra cero Titular: El entrenador cree que las lesiones no descarrilarán a los Warriors Temas: El entrenador confía en que las lesiones no descarrilen la temporada de los Warriors. El equipo sigue centrado en sus objetivos y seguirá trabajando duro para lograrlos.
Pocas muestras Titulares: Correa de los Mellizos optará por rescindir contrato y probará aguas de la agencia libre Temas: Béisbol Titulares: La Copa Mundial de Qatar tendrá zonas de sobriedad Temas: Fútbol Titulares: Yates: Semana 6 Fantasy Football Intelligence Temas: Fútbol Titulares: El entrenador cree que las lesiones ganan t descarrilar a los guerreros Tema: baloncesto

El ejemplo anterior demuestra la utilidad del aprendizaje en pocas oportunidades. Sin estos ejemplos, el modelo parece estar adivinando el comportamiento deseado, mientras que los ejemplos le muestran claramente cómo hacerlo. Esto también demuestra el poder del modelo, que puede inferir la categoría de etiqueta deseada aunque la etiqueta "baloncesto" no esté presente en el ejemplo.

instruir

Las instrucciones actúan como un "inicio rápido" para la salida del modelo, ayudando a dirigir el modelo hacia la salida deseada. Suele ser un prefijo a partir del cual se puede construir el modelo como base. En el siguiente ejemplo, demostramos instrucciones para guiar una historia e incluir elementos clave. Las instrucciones se utilizan a menudo junto con las instrucciones, pero no siempre. En el siguiente ejemplo, el modelo se utiliza para agregar correos electrónicos de anuncios largos. Las indicaciones se utilizan en un caso para ayudar a enfocar la salida del modelo y en otro caso para sugerir un formato de salida específico (viñetas).

En el contexto de la API de finalización de chat, las instrucciones toman la forma de mensajes del sistema que indican ejemplos breves para ayudar a iniciar el modelo al proporcionar una serie de interacciones de usuario/asistente de muestra.

Número de instrucción Inmediato Terminación
0 Las revisiones de desempeño son un componente central del enfoque de desempeño y desarrollo que implementamos en Contoso. […] Para resumir el correo electrónico anterior: El objetivo de este correo electrónico es notificar a los empleados sobre cambios recientes en su experiencia de evaluación del desempeño como parte del enfoque de Rendimiento y desarrollo de Contoso. Estos cambios incluyen una estructura mejorada, una experiencia de usuario mejorada en la herramienta y sugerencias destacadas. Además, ahora hay una sección opcional "Inicio de conversación" para que los empleados marquen los temas que desean discutir con sus gerentes.
1 Las revisiones de desempeño son un componente central del enfoque de desempeño y desarrollo que implementamos en Contoso. […] Para resumir el correo electrónico anterior: las conclusiones clave del correo electrónico son Contoso mejora la experiencia de revisión del desempeño al centrarse más en las prioridades, las expectativas y el impacto principales. Además, utilizan consejos, recursos y guías para mejorar la experiencia del usuario en la herramienta. Finalmente, agregaron orientación sobre cómo activar las prioridades centrales de toda la empresa.
2 Las revisiones de desempeño son un componente central del enfoque de desempeño y desarrollo que implementamos en Contoso. […] Para resumir el correo electrónico anterior: Puntos clave: • Contoso está implementando cambios en la experiencia de revisión del desempeño en función de los comentarios de los empleados. •Estos cambios incluyen un nuevo enfoque en las prioridades centrales, las expectativas y el impacto, una experiencia de usuario mejorada y una nueva orientación sobre las prioridades centrales de toda la empresa. •Las revisiones de desempeño son una oportunidad para reflexionar sobre el desempeño y el aprendizaje pasados ​​y para planificar prioridades y oportunidades de crecimiento futuras. •Los empleados y gerentes deben escribir reseñas antes de las reuniones de revisión del desempeño. •Las revisiones de desempeño deben realizarse al menos dos veces al año. •La inversión de tiempo debe seguir siendo aproximadamente la misma para cada evaluación.

Contenido de soporte

El contenido de respaldo es información que el modelo puede utilizar para influir en el resultado de alguna manera. Se diferencia del contenido principal en que no es el objetivo principal de la misión, pero suele utilizarse junto con el contenido principal. Los ejemplos comunes incluyen información contextual como fecha actual, nombre de usuario, preferencias del usuario, etc. El siguiente ejemplo utiliza contenido de soporte para ayudar a programar un conjunto de talleres planificados para los usuarios. Sin soporte (Temas importantes), el modelo solo enumera los talleres (truncados para mostrarlos), cuando se le informan mis Temas importantes, el modelo puede agrupar las sesiones con precisión.

Contenido de soporte Inmediato Terminación
No Lista de talleres: Título Descripción Planificación Lanzamiento del taller ¡Únase a nosotros para lanzar el taller! Escuche a nuestros líderes sobre las prioridades y aprendizajes de todos los grupos para el próximo año. Se han enviado invitaciones a este evento a todos en […] Para resumir los talleres anteriores, agrupados por tema: Lista de talleres: Inicio del taller de planificación – Resumen del taller de planificación – Reuniones principales – Perspectiva impulsada por el cliente – Áreas de impacto y enfoque – Mejores prácticas – Aceleración de la adopción de aplicaciones […]
tener Lista de talleres: Título Descripción Planificación Lanzamiento del taller ¡Únase a nosotros para lanzar el taller! Escuche a nuestros líderes sobre las prioridades y aprendizajes de todos los grupos para el próximo año. Se han enviado invitaciones a este evento a todos en […] Temas que me importan: Ingeniería rápida, Búsqueda, Modelos GPT Para resumir los talleres anteriores, agrupados por Temas que me importan: 1. Ingeniería de sugerencias: - Nuevos consejos de ingeniería de sugerencias - El arte de la ingeniería de sugerencias 2. Búsqueda: - Introducción a la búsqueda con vectores incrustados 3. Modelo GPT: - Introducción a GPT-4 - Una mirada en profundidad a GPT-35-Turbo .

mejores prácticas

  • Sea lo más específico posible . Deje el menor espacio posible a la interpretación. Limite el espacio operativo.
  • Sea descriptivo . Utilice analogías.
  • enfatizar . En ocasiones puede ser necesario realizar operaciones repetidas en el modelo. Proporcionar instrucciones, instrucciones de uso, instrucciones, etc. antes y después del contenido principal.
  • Clasificar las cosas . El orden en el que se presenta la información al modelo puede afectar el resultado. Su elección de colocar instrucciones antes del contenido ("Resumir lo siguiente...") o después ("Resumir lo anterior...") afecta el resultado. Incluso el orden de unos pocos ejemplos importa. Esto se llama "sesgo de actualidad".
  • Dale al modelo una "salida" . A veces puede resultar útil proporcionar al modelo una ruta alternativa si no puede completar la tarea asignada. Por ejemplo, al hacer una pregunta sobre un fragmento de texto, podría incluir algo como "Si la respuesta no existe, responda 'no encontrada'". Esto ayuda al modelo a evitar generar respuestas incorrectas.

eficiencia espacial

Aunque el tamaño de entrada aumenta a medida que el modelo GPT se itera, todavía hay casos en los que se proporcionan más datos de los que el modelo puede manejar. El modelo GPT divide las palabras en "tokens". Las palabras multisilábicas comunes suelen ser símbolos únicos, mientras que las palabras menos comunes se dividen en sílabas. En ocasiones, las etiquetas pueden resultar contradictorias, como se muestra en el siguiente ejemplo, que muestra los límites de las etiquetas para diferentes formatos de fecha. En este caso, deletrear el mes completo ocupa más espacio que usar fechas completamente numéricas. Rango de compatibilidad de etiquetas actual: los primeros modelos GPT-3 admiten 2000 etiquetas y la última versión del modelo GPT-4 de 32k admite hasta 32 768 etiquetas.
archivo
Dado que el espacio es limitado, asegúrese de utilizarlo de la forma más eficiente posible.

  • Tabular: como se muestra en el ejemplo de la sección anterior, el modelo GPT puede comprender datos en formato tabular muy fácilmente. Esta es una forma de contener datos que ahorra espacio, en comparación con anteponer a cada campo un nombre (por ejemplo, JSON).
  • Espacios: los espacios consecutivos se tratan como fichas separadas, lo que puede desperdiciar espacio fácilmente. Por otro lado, un espacio antes de una palabra suele considerarse parte del mismo token que la palabra. Observe atentamente el uso de los espacios y no utilice la puntuación cuando los espacios por sí solos serían suficientes.

archivo

Siga a TechLead y comparta conocimientos multidimensionales sobre la IA. El autor tiene más de 10 años de arquitectura de servicios de Internet, experiencia en investigación y desarrollo de productos de IA y experiencia en gestión de equipos. Tiene una maestría de la Universidad Tongji en la Universidad de Fudan, es miembro del Laboratorio de Inteligencia de Robots de Fudan y es un arquitecto senior certificado por Alibaba Cloud. , un profesional de gestión de proyectos e investigación y desarrollo de productos de IA con ingresos de cientos de millones.

Supongo que te gusta

Origin blog.csdn.net/magicyangjay111/article/details/135041392
Recomendado
Clasificación