El ADN de aterrizaje del modelo grande de China está escrito en esta estructura de doble hélice.

93d8b772ad068360c8ca708f546c3d42.jpeg

Con el rápido desarrollo de modelos a gran escala, la pregunta central de los modelos a gran escala de todos los ámbitos de la vida en la industria ha cambiado de "¿existe un modelo a gran escala?" a cómo implementar modelos a gran escala en la industria de IA de China. después de invertir activamente en la construcción? ¿Cómo deberían las grandes inversiones en construcción obtener retornos definidos y sostenibles?

De hecho, la característica más fuerte de la IA de China siempre ha sido su implementación.

Un indicador importante de la implementación de tecnología es la densidad de tecnología, es decir, la popularidad y la densidad de aplicación de una tecnología en la sociedad y la economía. En los últimos años, la tecnología de IA ha florecido en todas partes en las tierras de cultivo, fábricas, puertos, minas, campus, ciudades, etc. de China, algo que rara vez se ve en otras partes del mundo.

La revolución industrial no puede suceder de la noche a la mañana, China, que tiene una gran cantidad de escenarios comerciales y experiencia en la implementación de IA, también debe ser un puesto de avanzada para la implementación de modelos a gran escala.

Efectivamente, las preguntas y la curiosidad del mundo exterior sobre la implementación de la IA de China y los modelos a gran escala ya pueden responderse en el último progreso de Wenxin.

e1abc8033cd4b9d58583f392a5303285.png

El 6 de julio, en la Conferencia Mundial de Inteligencia Artificial (WAIC) de 2023, Wang Haifeng, director de tecnología de Baidu y director del Centro Nacional de Investigación de Ingeniería para Tecnología y Aplicación de Aprendizaje Profundo, interpretó la tecnología central de la versión 3.5 del Wenxin Large Model , y lanzó la última actualización de la ecología de la paleta voladora.Progreso, por primera vez reveló los últimos datos de la plataforma de aprendizaje profundo Flying Paddle, y explicó el modelo de la industria de inteligencia artificial.

El desarrollo coordinado de Wenxin y Flying Paddle forma una estructura de doble hélice. Al comprender este fragmento de ADN, podemos comprender más claramente el método y el camino para que la tecnología de inteligencia artificial de China continúe implementándose.

1. El muro invisible de la IA industrial

4a697c5121b2bcbbf3aed72ad21fa9fd.png

Cuando una tecnología va a la industria, hay tres factores que constituyen las restricciones que afectan su estructura de mercado: uno es el liderazgo tecnológico, el otro es la demanda del mercado y el tercero es la confiabilidad y disponibilidad del producto.

El liderazgo y la demanda del mercado de la tecnología de modelos a gran escala están, naturalmente, fuera de toda duda, por lo tanto, ¿puede el producto resistir la prueba de los usuarios industriales? Hay muchos escenarios de IA en China, implementación temprana y muchas prácticas, por lo que puede ver claramente un muro invisible de IA industrial. Los requisitos de los "tres máximos" que son comunes en todos los ámbitos de la vida son desafíos que deben superarse para la implementación. de modelos grandes:

Los requisitos de habilidad son altos. Algunas industrias con una buena base de TI serán las primeras en aplicar IA e implementar modelos a gran escala. Sin embargo, estos campos a menudo tienen escenarios comerciales complejos y algoritmos tradicionales que se han utilizado durante muchos años. Los medios técnicos son necesarios para la actualización y el reemplazo.

Los requisitos profesionales son altos. Cuando un modelo grande de uso general entra en un escenario empresarial subdividido verticalmente, se enfrentará a condiciones empresariales muy complejas. ¿A qué problemas y detalles se debe prestar atención, qué datos se necesitan y cuál es el objetivo? El modelo grande debe poder dominar el conocimiento propietario y la industria Saber como un experto de la industria -Cómo.

c0f15bd98a723102057ff07532189ff9.png

Los costos de desarrollo son altos. Debido a la complejidad y diversidad de los escenarios de la industria, la implementación de modelos grandes requiere capacitación y ajustes específicos. Sin embargo, muchas industrias y empresas carecen de suficientes talentos de TI y recursos informáticos para el desarrollo personalizado, lo que ralentiza la implementación de modelos grandes.

Los requisitos de los "tres altos" restringen la implementación de la tecnología de IA, lo que también hace que el modelo a gran escala vaya a la industria, que aún está en pañales.

deb23d317923ff15bbc9cb8b77b60fa8.png

2. Un fuerte ejemplo del modelo chino a gran escala

Cavar a través de las paredes de la IA industrial requiere equipo pesado. En la Conferencia Mundial de Inteligencia Artificial, Wang Haifeng compartió la innovación tecnológica central de Wenxin Model 3.5.

En comparación con la versión 3.0 del modelo a gran escala de Wenxin, la versión 3.5 del modelo a gran escala de Wenxin se ha mejorado ampliamente en términos de efecto, función y rendimiento, y ha realizado actualizaciones de capacidad como la actualización del modelo básico, la innovación tecnológica de ajuste fino, mejora del punto de conocimiento y mejora del razonamiento lógico.

Lo que es más notable es que a nivel de aplicación, el modelo grande de Wenxin ha mostrado una serie de métodos para liberarse de las restricciones y apuntar a la implementación, lo que puede convertirse en una demostración de la industria.

Las varias innovaciones tecnológicas importantes de Wenxin Large Model 3.5 han cumplido las tres fuertes expectativas de todos los ámbitos de la vida en modelos grandes:

Una es la expectativa de productividad avanzada.

En el análisis final, los modelos grandes deben ser confiables y estar disponibles para mejorar la calidad y la eficiencia de la industria. Los dos principales puntos de actualización de Wenxin Large Model 3.5 se centran en esto:

En primer lugar, se actualiza el modelo básico, basado en paletas voladoras para acelerar la iteración del modelo, mejorar el efecto y la seguridad del modelo y, al mismo tiempo, el equipo de I + D de modelos grandes de Baidu Wenxin ha innovado un multitipo, multietapa, ajuste fino supervisado, modelo de recompensa de múltiples niveles y granularidad y modelo de pérdidas múltiples.La estrategia de optimización híbrida de funciones, la optimización del modelo combinada con volantes dobles y otras tecnologías mejoran aún más el efecto del modelo y la capacidad de adaptación de la escena.

Además, se mejoró el razonamiento lógico de Wenxin Model 3.5 y se desempeña mejor en los campos de comprensión semántica, cálculo matemático y generación de código.Estas tareas ocurren con frecuencia en los negocios reales. Wang Haifeng dio un ejemplo. Baidu tiene una gran cantidad de ingenieros que escriben código todos los días. Wenxin Yiyan puede usar la capacidad de generación de código de modelos grandes para ayudar mejor a los ingenieros a mejorar la eficiencia de la escritura de código y mejorar efectivamente la productividad.

3ab6f97a16c23655c90a30dbc5938847.png

El segundo es la expectativa de los expertos de la industria.

Se ha convertido en un consenso que los modelos grandes deben adaptarse a los escenarios de la industria para resolver problemas prácticos más profesionales en los negocios. Esta versión 3.5, a través de las dos principales innovaciones técnicas de "ajuste fino" + "mejora del punto de conocimiento", permite que el modelo grande tenga la misma capacidad especializada que los expertos de la industria.

La tecnología de ajuste fino supervisado puede adaptarse a los escenarios comerciales de manera específica, lo que hace que los resultados sean más confiables, a fin de satisfacer mejor las necesidades de los escenarios comerciales para los efectos del modelo y la seguridad. La tecnología de mejora del punto de conocimiento, sobre la base de la mejora del conocimiento anterior y la mejora de la recuperación, inyecta puntos de conocimiento más específicos, más detallados y más profesionales en el modelo grande, mejora significativamente la comprensión y la aplicación del conocimiento mundial del modelo grande, y completa mejor la tarea profesional . Por ejemplo, al generar informes, Wenxin Big Model puede analizar y comprender las consultas y preguntas ingresadas por los usuarios, analizar los puntos de conocimiento relevantes necesarios para generar respuestas y generar contenido que se adapte mejor a las características comerciales.

El tercero es la expectativa de aplicaciones ricas.

Las aplicaciones ricas y coloridas en los teléfonos inteligentes son el requisito previo para la prosperidad de la industria de Internet móvil. Los usuarios también necesitan herramientas de aplicación diversas, ricas y fáciles de usar cuando usan modelos grandes, lo que requiere un mecanismo de complemento para satisfacerlas.

El nuevo mecanismo de complemento de Wenxin Large Model 3.5 puede expandir el límite de capacidad del modelo grande y aplicarlo a varios escenarios de manera meticulosa y eficiente. Por ejemplo, el resumen de texto largo de Wenxinyiyan y el complemento de preguntas y respuestas ChatFile admite la entrada de texto muy largo y puede formar información clave, como temas de reuniones, resúmenes y resúmenes en escenarios de oficina, lo que ayuda a mejorar la eficiencia del trabajo.

Wang Haifeng también dijo que Wenxin Yiyan lanzará más complementos oficiales y de terceros de Baidu de alta calidad para que los usuarios puedan usar mejor el modelo de Wenxin. Al mismo tiempo, abrirá gradualmente el ecosistema de complementos para ayudar los desarrolladores crean sus propias aplicaciones.

Con una gran cantidad de excelentes desarrolladores e ingenieros de software que crean complementos exclusivos basados ​​en el modelo grande de Wenxin, no solo se mejorará aún más la facilidad de uso y la adaptabilidad industrial del modelo grande, sino que el espacio del mercado de aplicaciones creado también es enorme.

La curva de actualización de Wenxin Large Model 3.5 está muy en línea con las expectativas de la industria. De esto se puede ver que el modelo grande de Wenxin siempre está listo para aterrizar en miles de industrias.

3. El aterrizaje de grandes modelos requiere energía sostenible

534c7b8e053a990fccae7b379481fff5.png

Solo los modelos grandes no son suficientes. Wang Haifeng propuso que en el proceso de implementación de industrias de modelos grandes como Wenxinyiyan, se puede adoptar el modelo de "producción intensiva y aplicación de plataforma", es decir, un modelo con ventajas integrales en algoritmos, poder de cómputo y datos La empresa encapsula el complejo proceso de producción de modelos y proporciona servicios de modelos a gran escala para miles de industrias a través de una plataforma de producción de bajo umbral y alta eficiencia.

El modelo grande de Wenxin puede tomar la delantera al quedarse atascado en la posición clave donde aterriza el modelo grande, que es inseparable de otra curva ascendente detrás de él: la optimización conjunta de las paletas voladoras.

9b6b5d8d8ae95d003b738bf6e21fa076.png

La habilitación integral de Flying Paddle a Wenxin tiene cuatro niveles:

En primer lugar, la paleta voladora admite el desarrollo, el entrenamiento y el despliegue de inferencia de modelos grandes, y mejora de manera integral la eficiencia del aterrizaje de modelos grandes. El entrenamiento y la iteración de modelos grandes consumen mucho tiempo y costo de entrenamiento.Después de la optimización colaborativa de Flying Paddle y Wenxin Large Model, el efecto del modelo del Wenxin Large Model 3.5 recientemente actualizado se ha mejorado en un 50%, la velocidad de entrenamiento ha se ha duplicado, y la velocidad de razonamiento ha sido mejorada.Aumentada en 30 veces.

En segundo lugar, el modelo grande de Wenxin se ha convertido en una parte importante de la biblioteca de modelos Flying Paddle.A través de la plataforma Flying Paddle para el ajuste fino y el despliegue de razonamiento, puede admitir de manera efectiva las aplicaciones de miles de industrias y reducir el umbral para que las industrias obtengan grandes modelos

En tercer lugar, Flying Paddle proporciona una plataforma y una herramienta de industrialización de proceso completo para resolver los puntos atascados y bloqueados en el desarrollo de modelos grandes, como modelos de gran tamaño, alta dificultad de entrenamiento, alto consumo de energía informática, etc., para satisfacer mejor las necesidades. de las empresas para desarrollar y aplicar la demanda de grandes modelos.

fbd9f9d4c242acc4a5e0cd11f350301a.png

Además, la industria de implementación de modelos a gran escala es inseparable de los talentos. Flying Paddle ha reunido a 7,5 millones de desarrolladores y ha apoyado a una gran cantidad de empresas para producir una gran cantidad de modelos. Ha cultivado una gran cantidad de nuevos talentos para la IA de China, que es una fuerza vital para la implementación de modelos a gran escala.

Se puede ver que la tecnología y la acumulación ecológica de paletas voladoras están inyectando un flujo constante de ímpetu en la industrialización de los modelos grandes de Wenxin.

63b6021a2848a024536a4629d429521d.png

4. IA china

Echar raíces con este ADN

En la conferencia, Wang Haifeng también demostró la aplicación de Wenxin Yiyan en la oficina, reuniones, codificación y otros escenarios. Se puede decir que Wenxin Yiyan ya tiene una gran cantidad de nuevos escenarios de aterrizaje, y este sólido rendimiento de aterrizaje debería poder disipar las preocupaciones del mundo exterior sobre el desarrollo sostenible de los modelos a gran escala de China.

A partir del ADN de doble hélice formado por Wenxin y Flying Paddle, se puede ver que la IA de China es práctica y está orientada a la industria, y la industria de modelos a gran escala de China también ha comenzado a mostrar una tendencia de desarrollo de este tipo:

1. Umbral bajo. A través de la innovación tecnológica de cada puerto, se han formado las características de la tecnología integral de inteligencia artificial de bajo umbral, lo que hace que el desarrollo, la adquisición y la aplicación de modelos sean más convenientes y accesibles.

2. Alta eficiencia. La colaboración de pila completa de chips, marcos, modelos y aplicaciones ha producido un efecto multiplicador de crecimiento continuo en la eficiencia, acelerando enormemente la implementación de modelos.

3. Industria de la comunicación. El enlace completo de desarrollo, capacitación, implementación y aplicación de IA está recibiendo cada vez más soporte completo. "Producción intensiva, aplicación de plataforma" hace que el modelo grande sea más adecuado para las necesidades reales de la industria y la industria, y empodera a la industria para se inteligente.

fb3ef1ac82b3fbdadeaeabd55b10e60c.png

El aterrizaje se ha convertido en el ADN de la IA de China, y los modelos grandes no son una excepción. La tecnología de inteligencia artificial y la productividad avanzada representada por modelos grandes se han arraigado en todos los ámbitos de la vida, razón por la cual la revolución inteligente definitivamente ocurrirá en China.

2aa30bfa7b2e609ef92e546bed849f03.gif

Supongo que te gusta

Origin blog.csdn.net/R5A81qHe857X8/article/details/131587679
Recomendado
Clasificación