Baidu, NVIDIA, Intel... los principales fabricantes se reunieron para discutir el plan de prácticas innovadoras de capacitación, promoción e implementación de modelos a gran escala bajo la ecología compartida de Wenxin y Flying Paddle.

¡Se acerca la cumbre WAVE SUMMIT 2023, patrocinada por el Centro Nacional de Investigación de Ingeniería para Tecnología y Aplicación de Aprendizaje Profundo y realizada por Baidu Flying Paddle y Wenxin Big Model! Esta cumbre se centra en las direcciones principales de la tecnología de IA, la ecología industrial y las tendencias futuras. Grandes nombres de todos los ámbitos de la vida, incluida la producción, el aprendizaje, la investigación y el uso, se centrarán en el desarrollo y el futuro del aprendizaje profundo y a gran escala. tecnología modelo, que presenta conocimientos sobre la industria y una serie de nuevos éxitos de taquilla. Hoy, presentaré los aspectos más destacados del foro paralelo "Smart Hard Core Ecological Co-creation", ¡vamos a echar un vistazo!

Detalles del evento
El Foro Paralelo "Co-creación Ecológica de Núcleo Duro Inteligente" tiene el honor de invitar a Liang Xiaoyao, profesor y líder de materia del Departamento de Ciencias Informáticas e Ingeniería de la Universidad Jiaotong de Shanghai, como presidente del foro. Varios expertos senior y representantes empresariales entre los miembros del plan de creación conjunta ecológica de hardware compartirán con usted la integración y cooperación en profundidad y las actualizaciones de capacidad en términos de potencia informática y algoritmos, y discutirán conjuntamente el esquema de integración de software y hardware. basado en la construcción ecológica compartida de Wenxin y Flying Paddle y planes de práctica innovadores, compartiendo tecnologías de vanguardia para el entrenamiento de modelos grandes y el despliegue de razonamiento.
reportar tema

inserte la descripción de la imagen aquí

Liang Xiaoyao

Profesor y Líder Académico, Departamento de Informática e Ingeniería, Universidad Jiaotong de Shanghai

Colaboración de software y hardware para construir una ecología industrial a gran escala

La demanda de poder de cómputo está explotando bajo el modelo grande, cómo buscar un avance en los chips de poder de cómputo, y la construcción de un ecosistema colaborativo de software y hardware es la clave. El rápido ascenso de los modelos grandes en el último año le ha dado a la industria de chips una oportunidad histórica para rejuvenecer. En este momento, es necesario reunir el poder de toda la industria, ya sea el jefe supremo actual o un novato en ascenso, para unir esfuerzos y crear una excelente ecología modelo a gran escala.

inserte la descripción de la imagen aquí

Zheng bin

NVIDIA×Flying Paddle, líder sénior de productos, NVIDIA Asia Pacífico
: Rendimiento extremo, que permite que la IA se use en miles de industrias.
Las aplicaciones de IA generativa han florecido. En los últimos seis meses, nuestros estilos de vida han cambiado profundamente y nuestra eficiencia de producción y la productividad ha mejorado mucho Capacidad para trabajar. En este discurso de apertura, se compartirá que al usar la nueva pila de hardware y software de NVIDIA, los desarrolladores de modelos de lenguaje extenso (LLM) pueden reducir los costos y aumentar la eficiencia, lograr la innovación tecnológica y ganarse la confianza de las empresas de LLM a través de funciones informáticas confidenciales. .

inserte la descripción de la imagen aquí

zhao yuping

Intel Arquitecto de inteligencia artificial
Intel×Flying Paddle: la aceleración del núcleo llega lejos, comparte el nuevo diseño de IA
Desde que comenzó la cooperación en 2017, Baidu Flying Paddle e Intel han seguido ampliando la profundidad y amplitud de la cooperación. equipo, desde el hardware Adaptarse activamente a los productos de IA de pila completa de Intel A nivel de software, las dos partes también han llevado a cabo una cooperación profunda, que se compartirá en detalle en este discurso de apertura. Mientras tanto, recientemente los modelos de lenguaje extenso (LLM, por sus siglas en inglés) están conquistando todo el mundo del aprendizaje automático. LLM requiere mucha potencia informática para cumplir con los requisitos de baja latencia de algunos escenarios, y los costos asociados pueden ser prohibitivos para muchas organizaciones. En este discurso de apertura, analizaremos las técnicas de optimización para reducir el tamaño de LLM y la latencia de inferencia para que puedan ejecutarse de manera eficiente en los procesadores Intel Xeon de cuarta generación llamados AMX (Advanced Matrix Acceleration Engine).

inserte la descripción de la imagen aquí

Ming Libo,
Gerente General del Departamento de Promoción y Aplicación de Computación Inteligente de Sugon
Sugon × Flying Paddle: servicio de computación pública que apoya completamente la transformación digital
Con la madurez continua de los modelos de gran escala, la industria de la inteligencia artificial ha entrado gradualmente en la era 2.0. Sugon y Baidu Flying Paddle tienen una cooperación profunda en los campos de preentrenamiento de modelos grandes, ajuste fino de modelos industriales, adaptación y acoplamiento de aplicaciones, construcción de centros comerciales de aplicaciones, etc., y continúan mejorando la ecología blanda y dura de la inteligencia artificial. , proporcionando una base sólida para el desarrollo y la implementación de la tecnología de inteligencia artificial de próxima generación.
inserte la descripción de la imagen aquí

XuZhen

Gerente general de Kunlun Core Government Enterprise/Smart Computing Center Business

Kunlun Core × Flying Paddle: Optimización de extremo a extremo para crear potencia de "núcleo" de IA en la era de los modelos grandes

La era de los modelos a gran escala plantea desafíos para el suministro de potencia informática. Kunlun Core se adhiere a la innovación colaborativa de software y hardware, y lanza soluciones integrales para modelos a gran escala en respuesta a la demanda del mercado, liderando la industria. en el desempeño y los resultados de la implementación. Frente a las oportunidades sin precedentes que brindan los modelos grandes, Kunlun Core se une firmemente a socios ascendentes y descendentes como Baidu Flying Paddle para acelerar la mejora de la competitividad central "central" de la industria de inteligencia artificial de mi país.

inserte la descripción de la imagen aquí

Yan Yan
, director de I+D de aplicaciones de software de
Tianshu Zhixin Tianshu Zhixin×Flying Paddle: establecimiento de raíces y cimientos para crear un paradigma básico para la industria de modelos a gran escala
Tianshu Zhixin, como una de las primeras empresas nacionales que realizó la producción en masa de modelos generales basados ​​en la nube GPU de propósito, ha logrado muchos casos en el campo de aterrizaje de modelos grandes, incluido el entrenamiento previo de casi 100 mil millones de parámetros basado en la escala de kilocalorías, ajuste fino de parámetros de parámetros completos / de alta eficiencia, razonamiento de modelos a gran escala de la industria todo- en una máquina, etc. La pila de software es compatible con la ecología principal. El producto de capacitación Tiangai 100 ha completado rápidamente la adaptación de tres niveles y el reconocimiento mutuo con el marco de la paleta voladora en un corto período de tiempo. En el período posterior, las dos partes seguirán cooperando en la dirección de plataformas completas de capacitación, razonamiento y algoritmos basadas en la ecología abierta para construir conjuntamente La solución que integra software y hardware empodera a la industria.

inserte la descripción de la imagen aquí

Ding Yunfan

Vicepresidente de Arquitectura de Sistemas de Biren Technology
Biren Technology × Flying Paddle: La innovación no tiene fin, y existen enormes brechas en el entrenamiento distribuido de modelos grandes similares a GPT en la construcción de instalaciones de IA de propósito general de alto rendimiento en
términos de la escala de parámetros del modelo, la escala de potencia informática y el rendimiento del entrenamiento Desafíos, la aplicación de modelos grandes también tiene problemas de alto costo y larga demora. Este informe presenta principalmente la estrategia de entrenamiento paralelo distribuido del modelo grande de GPT, cómo construir un sistema de entrenamiento de modelos grandes y un motor de inferencia de modelos grandes de alto rendimiento y baja latencia basado en la GPU de propósito general de gran poder de cómputo de Biren Technology, y finalmente comparte Biren Technology y Baidu Flying Paddle Cooperation y el progreso en la ecología básica y modelos a gran escala de software y hardware de inteligencia artificial.

inserte la descripción de la imagen aquí

Foro de mesa redonda: el modelo grande de Wenxin potencia la IA de extremo a extremo

Baidu, Qualcomm, MediaTek y Amou Technology, tres empresas de evaluación comparativa de hardware de extremo a extremo, discutieron conjuntamente la perspectiva de la aplicación del modelo grande de Wenxin que potencia la IA de extremo a extremo. Representantes de tres compañías de hardware compartirán sus últimos avances en hardware de extremo que admite tecnología de modelos a gran escala, analizarán cómo combinar el modelo a gran escala de Wenxin con productos de tecnología de hardware de extremo y utilizar las potentes funciones del modelo a gran escala de Wenxin para promover aún más de extremo a extremo El desarrollo de aplicaciones laterales de IA para satisfacer las necesidades cada vez mayores de los usuarios.

Además, Flying Paddle + Wenxin Large Model se unirá a los fabricantes de hardware para lanzar conjuntamente el Plan de cocreación ecológica de Flying Paddle + Wenxin Large Model Hardware en este foro.
inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/PaddlePaddle/article/details/132211119
Recomendado
Clasificación