En el proceso de exploración real, los profesionales pueden tener dificultades para encontrar un modelo de IA adecuado para su propia aplicación: ¿deberían elegir LLM o ajustar el modelo? Si usa LLM, ¿cuál debería elegir?
Recientemente, académicos de Amazon, Texas A&M University, Rice University y otras instituciones han discutido el desarrollo de modelos de lenguaje como ChatGPT, y sus artículos también han sido retuiteados por Yann LeCun.
Papel: https://arxiv.org/abs/2304.13712
Recursos relacionados: https://github.com/Mooler0410/LLMsPracticalGuide
Desde la perspectiva de la aplicación práctica, este artículo discutirá las tareas aplicables a LLM y los problemas prácticos de modelos, datos y tareas que deben tenerse en cuenta al elegir un modelo.
1. Introducción
En los últimos años, el rápido desarrollo de modelos de lenguaje a gran escala (LLM) ha desencadenado una revolución en el campo del procesamiento del lenguaje natural (NLP). Estos modelos son muy potentes, con