El modelo grande de código abierto más potente, Llama 3, se lanza en Gitee AI

Introducción: El 18 de abril, Meta lanzó dos modelos de código abierto Llama 3 8B y Llama 3 70B para uso gratuito por parte de desarrolladores externos. Este lanzamiento no es solo una muestra de innovación tecnológica, sino también una manifestación del espíritu del código abierto, lo que indica que un nuevo capítulo en las aplicaciones de IA está a punto de comenzar.

Esta vez, Meta ha abierto dos modelos, Llama 3 8B y Llama 3 70B, con dos versiones: preentrenamiento y ajuste de instrucciones respectivamente.

Enlace de plataforma

Visita el siguiente enlace e ingresa a la plataforma para experimentarlo (código de invitación: llama3):

https://ai.gitee.com/hf-models/meta-llama/Meta-Llama-3-8B-Instruct

Máximo 400 mil millones de parámetros

Meta Llama 3 introduce una serie de innovaciones técnicas, incluida la compatibilidad con ventanas de contexto más largas, múltiples tamaños de modelos y un rendimiento mejorado. Además, el nuevo modelo se ha desempeñado al más alto nivel en múltiples evaluaciones comparativas de la industria, especialmente sus mejoras en el razonamiento lógico y el seguimiento de instrucciones de programación, lo que lo hace único entre modelos similares de código abierto.

Los aspectos más destacados y características de Llama 3 son los siguientes:

  • Según el entrenamiento con más de 15T tokens, el tamaño es más de 7 veces mayor que el del conjunto de datos de Llama 2;

  • La eficiencia del entrenamiento es 3 veces mayor que la de Llama 2;

  • Admite texto largo de 8K y el tokenizador mejorado tiene un vocabulario de 128K tokens para lograr un mejor rendimiento;

  • Rendimiento de última generación en una amplia gama de puntos de referencia importantes;

  • Mejorar las habilidades de razonamiento y codificación;

  • Hay un gran avance en seguridad. Las nuevas herramientas de confianza y seguridad con Llama Guard 2, Code Shield y CyberSec Eval 2 también pueden tener un mejor "rendimiento de rechazo de errores" que Llama 2.

Sostenibilidad y compromiso comunitario

Meta Llama 3 es más que un simple producto tecnológico, también representa el compromiso de Meta con el desarrollo continuo. Al hacer que este modelo sea de código abierto, Meta espera estimular el potencial innovador de la comunidad global de desarrolladores y promover conjuntamente el avance de la tecnología de inteligencia artificial. Esta medida no sólo promueve la popularización de la tecnología, sino que también garantiza que los comentarios de la comunidad se tengan plenamente en cuenta durante el proceso de desarrollo.

Pensamiento avanzado en seguridad y ética

Al desarrollar Meta Llama 3, Meta prestó especial atención a la seguridad y la responsabilidad ética. Las herramientas recientemente introducidas, como Llama Guard 2 y CyberSec Eval 2, brindan a los desarrolladores más recursos para usar e implementar estos modelos de manera responsable. Esto demuestra el liderazgo de Meta en la industria a la hora de garantizar una implementación segura y confiable de la IA.

El lanzamiento de Meta Llama 3 no es sólo un avance tecnológico, sino también una manifestación del espíritu de innovación abierta. No sólo proporciona a los desarrolladores nuevas y potentes herramientas, sino que también establece nuevos estándares para el desarrollo futuro del ecosistema global de IA. En la ola de la IA, Meta ha demostrado el poder de la cooperación y la innovación a través de Llama 3 y espera que esta plataforma inspire aplicaciones más innovadoras de la inteligencia artificial.

Supongo que te gusta

Origin www.oschina.net/news/288516
Recomendado
Clasificación