Charla en profundidad 丨 Cuarto Paradigma Chen Yuqiang: ¿Cómo usar modelos grandes de IA para abrir el mercado de software tradicional a escala de un billón?

Texto 丨 Querido Data Tan Jing

"¿Se puede usar el modelo grande GPT? ¿Dónde se usa?"

Este es uno de los temas que más preocupan a los líderes de las grandes empresas chinas en la actualidad. Los medios de comunicación también llaman al modelo grande de IA el proyecto "máximo líder".

Las grandes empresas se toman muy en serio el uso de modelos grandes. En los últimos meses, Chen Yuqiang, científico jefe de 4Paradigm, se ha mostrado emocionado por la respuesta entusiasta de los clientes de grandes empresas al modelo grande.

Me dijo que hay muchas voces de clientes:

"Una gran empresa tradicional (finanzas, energía, transporte) invierte en el desarrollo de un modelo grande para escribir un poema, un artículo, un resumen o generar una imagen hermosa. Este costo es demasiado alto para la empresa " .

Frente al mercado de nivel empresarial a gran escala, ¿cuáles son las necesidades del cliente?

La curiosidad y las dudas también inundan el mercado. Las grandes empresas están pensando detenidamente cómo hacer un buen uso del modelo de "gran inversión y alto costo". La esencia es cómo la tecnología puede crear valor para las grandes empresas.

Hay varias respuestas, y la respuesta dada por el cuarto paradigma es AIGS, que se refiere al software generado por IA.

Paradigm cree que el propósito central de los grandes modelos de IA es ayudar a las grandes empresas a mejorar los procesos y la eficiencia de desarrollo de software, así como mejorar la experiencia del usuario del software empresarial.

El modelo grande de 4Paradigm se llama "Shi Shuo", que es una plataforma de desarrollo basada en la base de modelo grande multimodal.

De febrero a abril de 2023, los productos Shishuo han completado tres generaciones de iteraciones, centrándose en la reconstrucción de modelos a gran escala de software empresarial.

¿Cómo refactorizar y dónde?

En el desarrollo de software, las funciones de los productos To C están relativamente enfocadas, como compras, taxis, compras de comestibles, etc.;

Sin embargo, los productos To B son bastante diferentes. El software de nivel empresarial está altamente personalizado y enfrenta directamente problemas complejos y difíciles.

Las diferentes lógicas de funciones y ejecución, no es demasiado cortar una docena de capas de menús, y no es demasiado amontonar miles de funciones. Además, el software de nivel empresarial a menudo tiene un conocimiento sólido, conocimiento de la materia, conocimiento del negocio, conocimiento de la cadena de suministro, etc.

Cuando la complejidad de los productos de software empresarial se convierta en otra disciplina, forzará y afectará el pensamiento del desarrollo y diseño de software empresarial.Esta es una fuerte relación de acoplamiento.

Para los usuarios de software empresarial, hay más oportunidades de cometer errores, una velocidad de aprendizaje más lenta y una menor eficiencia en el trabajo.

Paradigm cree que estas dificultades dejan suficiente espacio de aplicación para la tecnología de IA generativa y su desarrollo. AI finalmente se hizo cargo del trabajo duro.

realizar una tarea de boxeo para mí

objetivo de la misión:

Analizar el tamaño de contenedores y cajas pequeñas, y diseñar esquemas de embalaje.

Click para agrandar

Todo el mundo no es ajeno al modelo generativo.Tiene muchas ventajas: resumen de texto, resumen de capítulo, dibujo rápido, múltiples rondas de diálogo y respuestas pacientes.

Sin embargo, las operaciones comerciales tienen objetivos Desde la perspectiva del costo, un modelo grande propiedad de una empresa no necesita ser omnisciente, y la experiencia es más adecuada para las necesidades de la empresa.

El gran modelo de IA para resolver problemas empresariales variará de un lugar a otro y de una escena a otra. La generación de imágenes es la demanda de las empresas de imagen o diseño (como Visual China), y la generación de textos publicitarios es la demanda de las empresas de publicidad.

Midjourney se convertirá en el favorito de aquellos que necesitan imágenes creativas, pueden ser amantes del arte, ilustradores, diseñadores, etc. ChatGPT se convertirá en el favorito de los trabajadores del conocimiento que escriben documentos, hacen presentaciones de PowerPoint y leen artículos.

Y Chen Yuqiang dijo: "No hay ninguna empresa en China que sea absolutamente líder en modelos a gran escala como OpenAI, y habrá más modelos a gran escala en China. Hacemos modelos a gran escala para centrarnos en escenarios comerciales, similares a todos en atletismo. Nos enfocamos en ciertas competencias, como el salto de altura, no en todas".

Aquí necesitamos un ejemplo de "núcleo duro" para profundizar nuestra comprensión del "escenario de software" mencionado por Chen Yuqiang.

Tomando el software industrial como ejemplo, Musk siempre ha considerado la capacidad de fabricación como la principal competitividad de Tesla Motors, y una de las fortalezas técnicas detrás de la capacidad de fabricación es el software industrial.

En la industria de fabricación de equipos de alta gama, el modelado digital es un escenario clave para las aplicaciones de datos. Los fabricantes invertirán mucho tiempo y recursos en el proceso de modelado digital.

Así que aquí viene la pregunta muy técnica:

1. ¿Cómo reducir el tiempo de búsqueda analógico-digital?

2. ¿Cómo respaldar el préstamo y la reutilización dentro de un modelo y entre modelos?

3. ¿Cómo usar el software para respaldar la escala y la serialización de las funciones existentes?

Creo que no hay necesidad de entender las tres preguntas del alma aquí, la esencia es que la mejora de la eficiencia y la resolución de esta serie de problemas pueden traer una gran competitividad a la industria manufacturera para mejorar la calidad del diseño del producto.

Los modelos grandes crecen a partir del corpus de Internet, pero este no es el caso cuando la "escena" se cambia a la industria de fabricación de equipos de alta gama. Hay cientos de miles de piezas de desarrollo propio y millones de modelos, sin mencionar la información ( descripción, etiqueta, atributo, parámetro, etc.) ).

ayúdame a encontrar piezas similares

se puede armar juntos

La dificultad aquí es que vale la pena probar la tecnología del modelo grande. El modelo grande se privatiza y se implementa en la planta de fabricación de equipos de alta gama, y sus preciosos datos de equipos de alta gama se utilizan para volver a aprender el modelo grande (Finetune) hasta la entrega. .

Paradigm cree que este es uno de los lugares donde vale la pena explorar la tecnología de modelos generativos.

La teoría de la fórmula refleja el pensamiento y el camino de la comercialización y localización de modelos a gran escala encontrados por el cuarto paradigma.

Cuando se trata de desarrollo de software, es fácil tener un malentendido aquí. El modelo grande tiene una buena capacidad para generar código Algunas personas pueden pensar erróneamente que 4Paradigm usa modelos grandes para ayudar a las empresas a generar código.

no es verdad.

En general, en términos de requisitos de modelo a gran escala a nivel empresarial, 4Paradigm aborda la experiencia de desarrollo de software y la eficiencia del desarrollo de software.

"Shishuo" 1.0 es un asistente de conocimiento de nivel empresarial, "Shishuo" 2.0 es Copilot y "Shishuo" 3.0 es COT (cadena de pensamiento).

Se dice que solo una pequeña parte de la función es generar código y, lo que es más importante, conecta las API y las aplicaciones existentes de la empresa a través de las capacidades de Copilot para formar una aplicación de estilo de diálogo.

Por ejemplo, se ha diseñado la fuerza y resistencia del tren de aterrizaje de la aeronave, el capitán decide cómo aterrizar el tren de acuerdo al tipo de aeronave (liviana y pesada), la fuerza de la pista del aeropuerto (lluvia, nieve y hielo ), en lugar de rediseñar el tren de aterrizaje.

El enfoque de la segunda etapa es la capacidad Copilot de nivel empresarial. Copilot admite el uso del diálogo para llamar funciones/datos integrados en el software para completar tareas.

La transformación de grandes modelos de software no solo puede tener capacidades de lenguaje.

Shishuo 2.0 ha agregado capacidades multimodales. Los empleados pueden iniciar consultas o dar instrucciones a Shishuo a través de métodos multimodales como voz, imagen, formulario y video.

No limitado a Copilot, la tecnología central de la tercera etapa es COT.

COT tiene la capacidad de razonamiento. La biblioteca de aplicaciones internas y el conocimiento privado y los datos de la empresa ingresan al modelo grande. Después de aprender una gran cantidad de datos y estrategias, se forma un paso intermedio, para dividir y ejecutar un trabajo complejo.

Entiendo que la cadena de pensamiento también es una imitación del pensamiento y el comportamiento humanos, las personas también completan las tareas paso a paso, y el pensamiento también es un eslabón.

Los modelos a gran escala son una revolución sedienta de sangre. Combinada con las características del mercado localizado de China, la privatización de los modelos a gran escala es la única forma de implementar los modelos a gran escala.

En mi opinión, esta actualización de Shishuo significa que el alcance comercial de 4Paradigm se expandirá desde los desarrolladores empresariales hasta el mercado de desarrollo de software.

Especulo que 4Paradigm no solo se centrará en la capa de plataforma de la pila de software de IA.

El modelo grande en sí se ha convertido en la infraestructura de IA. En la última ronda de marea de IA, los fabricantes que ya tenían la infraestructura son más poderosos, lo que significa que existe la oportunidad de llegar hasta la capa de aplicación.

Después de cuatro años de observación cercana de 4Paradigm, tienen una comprensión y una visión únicas de la metodología de la IA. Aquí hablaré sobre mi propia comprensión.

Los sistemas de software empresarial son tan complejos que dominarlos a todos es tan difícil como navegar en la cabina de un avión.

El costo del dominio global y la transferencia de conocimiento del software empresarial es muy alto y existen umbrales de conocimiento.

Desde la perspectiva de los usuarios empresariales (empleados), no es necesario comprender la lógica funcional y la lógica de ejecución detrás de la interfaz del software empresarial.

Los usuarios solo necesitan comunicarse en lenguaje humano (lenguaje natural) para usar las funciones del software empresarial, y no necesitan saber en qué nivel se encuentra la función, en qué botón hacer clic y qué función se encuentra debajo de una cierta docena de niveles de directorios de menú.

La búsqueda puede resolver búsquedas simples, los bots conversacionales pueden realizar tareas y las bases de conocimientos se pueden codificar en manuales.

El modelo grande aprenderá la "escena del software", incluido el contenido del manual de conocimiento empresarial y las funciones complejas del sistema de software, y el modelo grande ayudará a los empleados de la empresa a encontrar, comprender, invocar y ejecutar.

Es equivalente a tener un comandante en todos los sistemas de software de nivel empresarial. Detrás de este comandante está la habilidad del modelo grande. El 4Paradigm tiene un gran modelo generativo con cientos de miles de millones de parámetros, que se denomina modelo grande de Shishuo. Al trabajar, el comandante sigue las instrucciones del usuario.

Si se compara la operación comercial con un avión, cada empleado corporativo es el capitán, y el comandante es lo que solemos llamar el copiloto, que también es la traducción literal de la palabra inglesa Copilot.

Al principio, todo conocimiento puede ser respondido a través de "fórmulas", y la búsqueda es una forma preliminar.

Posteriormente, Shishuo estudió la base de conocimiento de la empresa e hizo un trabajo complicado con referencia a las reglas.

En el futuro, Shishuo tendrá la capacidad de dividir tareas complejas y razonamiento de varios pasos. Cuanto más "inteligente" sea el producto, más podrá hacer a nivel de comando.

Cuando la industria del software se transforme, el valor comercial y el modelo comercial de toda la industria darán un salto adelante. Este es un mercado enorme.

No hay tiempo que perder, esta puede ser la aspiración común de esta generación de empresas modelo nacionales a gran escala.

Chen Yuqiang dijo: "Después de completar esta actualización, muchos de nuestros socios y clientes han utilizado rápidamente esta nueva tecnología para transformar sus propios sistemas de software, optimizando en gran medida la experiencia y el costo del software".

A fines de abril de 2023, visité 4Paradigm y me comuniqué con los empleados de Paradigm (lectores acérrimos).

Me dijeron: "Parece que la empresa ha regresado a los años en que comenzó su negocio. Los productos modelo a gran escala de la empresa son bien recibidos por el mercado. Se dice que la cantidad de clientes de 1.0 y 2.0 está aumentando cada día, y los casos de los clientes quedan atrapados dentro de la empresa. Mucho".

En febrero de 2023, 4Paradigm lanzó "Shishuo 1.0". En solo dos meses, vi los escenarios de aplicación de 16 clientes en el video del cliente en el sitio de lanzamiento.

Apenas el año pasado, la cantidad de clientes de 4Paradigm solo aumentó mensualmente, y la compañía también mantuvo deliberadamente un perfil bajo en el mercado.

Fundada en 2014, 4Paradigm es el primer participante en inteligencia artificial en China. Si puede encontrar el camino clave para que la tecnología modelo a gran escala cree valor para las empresas, 4Paradigm marcará el comienzo de una nueva ronda de crecimiento.

La ola anterior de emprendimiento de IA parecía estar estancada. Muchas empresas de ToB eran extremadamente competitivas y estaban atrapadas en el atolladero de la baja ganancia bruta y la alta personalización.

Esta ronda de lanzamientos de nuevos productos de 4Paradigm seguirá estando orientada hacia los servicios empresariales ¿En qué se diferencia el negocio de ToB a gran escala del anterior?

En mi opinión, el despliegue de privatización de modelos grandes es una necesidad urgente de algunas empresas nacionales, y ni siquiera es necesario decir la necesidad del despliegue de privatización.

Por ejemplo, algunos clientes financieros de 4Paradigm requieren que la red se pueda desconectar, porque las redes internas y externas son completamente inalcanzables y el modelo grande debe implementarse de forma privada.

Un modelo grande es una nueva productividad, y un modelo grande debe usarse como base. Por lo tanto, el umbral de entrada del mercado de IA de nivel empresarial se ha vuelto significativamente más alto, por lo que el consumo y la fricción con los competidores pequeños y medianos han aumentado. también ser menos.

En ese momento, el antiguo software de IA era más como una parte o componente importante, y era muy costoso encontrar una posición adecuada y un propósito adecuado en el mercado fragmentado.

Se espera que esta ronda de tecnología de modelos grandes supere la fragmentación de los algoritmos de IA, y las tareas independientes pueden resolver el dilema que requiere una alta personalización.

En términos de escala y costo del proyecto, no puede ser un negocio de bajo margen. Tomar la infraestructura a gran escala como proyecto piloto, seguido de la construcción de aplicaciones por lotes, está en línea con las reglas comerciales y es adecuado para el mercado de servicios de nivel empresarial.

Los esfuerzos no son en vano, y 4Paradigm ha encontrado la dirección de los servicios de nivel empresarial a gran escala, y vale la pena.

-Finalizar-