Recomprensión de Baidu Smart Cloud: escrito 24 horas después de la apertura del modelo grande

Una realidad común detrás de estas respuestas es que el modelo grande ya no es una pregunta de opción única, sino una pregunta integral. En esta nueva era, los productos, servicios, seguridad, apertura, etc. deben convertirse en necesidades, e incluso desde la perspectiva de la implementación empresarial, son solo necesidades. 

Autor | Pi Ye 

Producido | Industrial 

En los últimos cinco meses, Li Liang ha estado muy ocupado.

"Desde el lanzamiento de Wenxin Yiyan en marzo de este año, muchas empresas industriales, incluso empresas estatales, han tomado la iniciativa de discutir con nosotros la implementación de modelos a gran escala. Cómo construir juntos una plataforma con servicios comunes".

Como ingeniero de Baidu Smart Cloud, en el último medio año, realmente sintió el entusiasmo de las empresas por los grandes modelos de IA. Este tipo de entusiasmo es la expectativa de las empresas de nuevas tecnologías con capacidad de implementación, y también es la ansiedad de preocuparse por quedarse atrás.

Esta no es una excepción.

Con las voces frecuentes de OpenAI y una gran cantidad de empresas modelo nacionales a gran escala, cada vez se presentan claramente más marcos de "modelo industrial + IA a gran escala" frente a las empresas. En comparación con tecnologías anteriores como metaverso y blockchain, AI La aplicación de modelos grandes está más cerca del escenario real de la empresa, la ruta de la aplicación es más corta y el efecto es más "inmediato".

Sin embargo, en el auge de la IA, cada vez más empresas están descubriendo una pregunta más realista: ¿cuál es el mejor punto de entrada para modelos a gran escala? En otras palabras, ¿cómo deberían las empresas construir de manera eficiente un modelo grande que se adapte a sí mismas?

Detrás del problema se esconden los "revéses" de muchas empresas en el camino hacia una transformación de modelo a gran escala. "El problema con muchas empresas ahora es que están dispuestas pero no tienen canales; o después de intentarlo, el progreso general es muy lento". Un inversor nos dijo: "El medio incluye la limpieza de datos, el etiquetado y la generación rápida, el modelo fino- tuning, entrenamiento, etc., no existe ningún método particularmente fácil de usar en el mercado”.

De hecho, estos fenómenos también constituyen el hecho de que, aunque las empresas todavía están entusiasmadas con los modelos a gran escala, cada vez más empresas están comenzando a dar el primer paso manteniendo una actitud "cautelosa" sobre la rentabilidad de participar.

Sin embargo, las buenas noticias sobre la aceleración de la IA aún están llegando. Apenas el 31 de agosto, grandes modelos como Baidu Wenxin Yiyan y SenseChat estuvieron entre los primeros en aprobar la presentación de las "Medidas provisionales para la gestión de servicios de inteligencia artificial generativa", abriendo oficialmente los servicios a toda la sociedad. Además, se informa que para los usuarios empresariales, Baidu Smart Cloud también anunciará cuatro medidas de apoyo en la Conferencia Baidu Yunzhi 2023 celebrada el 5 de septiembre, con el objetivo de ayudar a las empresas a utilizar modelos a gran escala a un costo menor y más rápido.

En medio de la avalancha de IA, ¿cómo deberían las empresas elegir un modelo grande que se adapte a sus necesidades? En otras palabras, en la era actual de la IA, donde los grandes modelos están abiertos, ¿qué tipo de modelo grande de IA puede convertirse en el mejor barco para las empresas en la era de la inteligencia digital de la IA?

En este momento, cuando se ha aprobado la entrada en línea de 8 modelos grandes, esta cuestión se está acelerando al frente.

1. La demanda de IA y la nueva propuesta industrial que la respalda

Antes de llegar a la respuesta, miremos el otro lado de la balanza: ¿cuál es la dificultad de implementar la IA del cliente?

"Ahora no todo el mundo está muy seguro de cómo se implementará el modelo grande en la industria, qué aplicaciones completamente disruptivas o dónde aparecerá este tipo de aplicación que puede generar una gran tendencia. De hecho, nuestros clientes también lo tienen muy claro. Date cuenta de esto", dijo un ingeniero de soluciones de Baidu Smart Cloud.

Este es el punto en común de muchas empresas nacionales que se enfrentan a grandes modelos de IA. Es decir, aunque la empresa tiene una comprensión completa de sus propios escenarios comerciales, no se sabe qué paso puede lograr el modelo grande y cómo utilizarlo para reducir costos y aumentar la eficiencia del negocio original.

Para algunas empresas que ya lo han intentado, el problema es más grave.

"Primero utilizamos modelos extranjeros de código abierto, pero recientemente también estamos considerando intentar volver a conectarnos con grandes modelos nacionales, porque la comprensión semántica china del código abierto extranjero es demasiado pobre y hay problemas con las interacciones básicas". -código de empresa La gente nos lo dice.

Sintió lo mismo por otra empresa agrícola. En el proceso de comunicación con su fundador, dijo sin rodeos: "Desde el principio hasta las rondas posteriores de capacitación, incluida la limpieza de datos, el etiquetado de alta calidad, etc. "..., la sobrecarga de todo el proceso es muy alta y el efecto de capacitación no es particularmente bueno, incluso peor que la interfaz original ". Hasta ahora, el producto modelo grande de esta empresa todavía se encuentra en la etapa de prueba interna y no ha sido utilizado externamente.

Además de éstas, hay más empresas estancadas en el "primer paso" del gran modelo: la selección.

Sin embargo, en la etapa de selección las empresas tienen preocupaciones diferentes. Para la mayoría de las pequeñas y medianas empresas en la actualidad, es difícil elegir un modelo porque no está claro qué modelo de empresa de gran escala de nivel inferior tiene fuertes capacidades industriales, que incluyen capacidades de productos y también existen requisitos para la implementación de servicios tales como ajuste de modelos y mejora del conocimiento.

Para las grandes empresas, además de la seguridad de los datos, la comprensión de la industria y la reutilización son las consideraciones centrales de las empresas. " Lo que las grandes empresas valoran más es que no solo es necesario ser eficaz en el negocio que valoro, sino que también es necesario ser más eficiente al combinarlo con los negocios existentes en términos de reutilización de todo el grupo ", dijo el antes mencionado. ingeniero.

En su opinión, las grandes empresas representadas por empresas estatales centrales esperan que los proveedores de servicios modelo a gran escala puedan desempeñar el papel de entrenador, no sólo para proporcionar buenas herramientas, sino también para enseñar a las empresas cómo utilizarlas, a fin de aumentar su valor en el largo plazo.

Desde una perspectiva más amplia, las dificultades actuales en la implementación de modelos a gran escala se pueden dividir aproximadamente en tres niveles: primero, las empresas no saben qué tipo de modelo a gran escala elegir, o no saben qué tipo de modelo a gran escala elegir. El modelo a escala puede satisfacer sus propias necesidades. Hay muy pocas opciones de modelos a gran escala; en segundo lugar, para algunas empresas que optan por construir sus propios modelos a gran escala, se topan repetidamente con obstáculos a nivel de cadenas de herramientas, como indicaciones rápidas, limpieza de datos, etiquetado y mejora china, con demasiada inversión o experiencia insuficiente; en tercer lugar, la seguridad y el cumplimiento de los datos de la propia empresa son relativamente altos y, al mismo tiempo, necesita un profundo conocimiento de la industria y tiene altos requisitos para el capacidades funcionales de los proveedores de servicios a gran escala.

No es difícil percibir que, si se desmonta desde la perspectiva de los servicios atomizados, la demanda de modelos grandes por parte de las empresas nacionales no se da solo a nivel de producto, como indicadores básicos como parámetros y razonamiento lógico, sino también a mayores puntos de demanda. En el lado del servicio, es una ventanilla única para satisfacer las necesidades de diferentes empresas, ya sea en el nivel rápido, en el nivel de mejora china, etiquetado de datos, capacitación o en el escenario industrial. adaptación e incluso seguridad de los datos, así como el nivel de costes básicos.

El modelo grande ha evolucionado silenciosamente desde una simple propuesta técnica a una propuesta industrial integral que combina tecnología, productos, servicios y otros vínculos.

2. Detrás de Qianfan, puedes ver la "verdadera expresión" del modelo grande.

Durante los meses de mayor actividad, Li Liang quedó muy impresionado con una empresa.

"Hay un socio en la industria minera que está deseando cooperar con nosotros en el campo de los modelos a gran escala. Quiere proporcionar servicios inteligentes para toda la mina a través de modelos a gran escala, incluida la gestión de la producción segura, alerta temprana de producción segura, etc." Dijo: "Estamos realizando múltiples rondas de pruebas con él ahora, y muchas de ellas tienen muy buenos resultados".

Lo que le sorprendió fue que las empresas tradicionales como las minas también comenzaron a buscar activamente en Baidu el progreso y la implementación de modelos a gran escala. Se entiende que después de varias rondas de cocreación por parte de las dos partes, un gran modelo basado en la escena de la mina está a punto de tomar forma.

De hecho, esta no es la primera empresa que encuentra activamente Baidu Smart Cloud. La interfaz de servicio unificada de Baidu Smart Cloud para estos socios de la industria es la plataforma modelo integral a gran escala a nivel empresarial "Baidu Smart Cloud Qianfan" lanzada oficialmente en marzo de este año.

Como única interfaz de modelo TO B a gran escala, Baidu Smart Cloud Qianfan también constituye la verdadera expresión de los modelos a gran escala de Baidu en diferentes escenarios industriales como energía, finanzas, asuntos gubernamentales y transporte, así como servicios que incluyen gestión de datos. capacitación, evaluación y optimización de modelos, y pronóstico Demostración de capacidades de todo el ciclo de desarrollo de modelos grandes, como ingeniería rápida y servicios de complementos.

Y en agosto pasado incluso entregó un brillante informe de calificaciones.

Un punto positivo es que entre los modelos anunciados esta vez, además del núcleo del modelo grande Wenxin, Baidu Smart Cloud Qianfan también está conectado de manera más completa a la serie completa de Llama 2, ChatGLM2-6B, RWKV-4-World, MPT- 7B-Instruct, Falcon-7B y otros 33 modelos grandes de código abierto, convirtiéndose en la plataforma con más modelos grandes en China.

En otras palabras, basándose en el "almacén modelo" de Baidu Smart Cloud Qianfan, además de los modelos grandes de Wenxin, las empresas pueden personalizar otros productos modelo básicos a gran escala que sean adecuados para ellas.

Además, a diferencia de otros almacenes modelo, Baidu Smart Cloud Qianfan ha realizado un "procesamiento secundario" de los modelos en el "almacén modelo".

Por ejemplo, en términos de seguridad, Qianfan ha realizado mejoras de seguridad en todos los modelos de terceros conectados, no solo garantizando la seguridad del contenido de los modelos grandes de Wenxin, sino también garantizando la salida segura de los modelos grandes de terceros; para cada gran modelo conectado modelo, Qianfan ha realizado mejoras de rendimiento secundarias.

Según los cálculos, después del ajuste del rendimiento, el volumen de modelos de terceros se puede reducir al 25% -50% y el costo de inferencia se puede reducir en un 50%. Esto significa que, en comparación con las llamadas directas, las empresas pueden ahorrar grandes costos y mejorar los resultados utilizando estos modelos en la plataforma Qianfan.

Al mismo tiempo, Qianfan se ha adaptado en profundidad al modelo a gran escala conectado, lo que proporciona a las empresas una cadena de herramientas completa para el reciclaje de modelos y varias formas de ajuste de modelos, incluido SFT (ajuste fino de parámetros completo, ajuste rápido, Lora) y aprendizaje por refuerzo (aprendizaje de modelos de recompensa, entrenamiento de aprendizaje por refuerzo) y más.

En otras palabras, basándose en Baidu Smart Cloud Qianfan, las empresas pueden crear sus propios modelos exclusivos de extremo a extremo, ya sea que elijan modelos grandes de Wenxin o modelos grandes de código abierto de terceros en la plataforma .

No solo eso, sino que en términos de capacidades de servicio externo, Baidu Smart Cloud Qianfan puede proporcionar a las empresas dos métodos de implementación de nube pública e implementación privada, incluido el razonamiento, el ajuste y el alojamiento del modelo a gran escala mencionado anteriormente. acceso y uso. En términos de implementación local, Baidu Smart Cloud Qianfan también puede ofrecer software puro e integración de software y hardware, cumpliendo plenamente con los requisitos de implementación local empresarial.

De hecho, estas capacidades también constituyen la implementación real de Baidu Smart Cloud Qianfan en muchas industrias. Según estadísticas incompletas, en los últimos cinco meses, la plataforma modelo a gran escala Qianfan se ha implementado en más de 400 escenarios industriales reales. Hasta ahora, el modelo a gran escala de Baidu Wenxin tiene la escala industrial más grande de China.

Estos aterrizajes constituyen nodos especiales del circuito de modelos a gran escala de China. Por ejemplo, en el nivel energético, el "Asistente de conocimiento de inspección de operación de equipos" creado conjuntamente por Baidu Smart Cloud y State Grid fue seleccionado como uno de los primeros diez casos de aplicación de modelos industriales a gran escala en Beijing. El "Modelo grande Shenran-Baidu·Wenxin" lanzado conjuntamente con Shenzhen Gas se basa en las capacidades del modelo a gran escala y solo necesita ser ajustado para formar capacidades de modelo industrial específicas y completar tareas en múltiples escenarios de aplicación.

Otro ejemplo es a nivel financiero, Baidu Smart Cloud y CITIC Financial Holdings han creado conjuntamente un humano digital basado en un modelo de gran tamaño, de modo que cada cliente del banco tiene su propio consultor financiero exclusivo, que puede realizar asistentes de investigación de inversiones, asistentes de consultoría de inversiones, y asistentes de marketing, asistente de cumplimiento, etc.

Estos perfiles reales de aterrizaje industrial también están más del lado de las pequeñas y medianas empresas. Según estadísticas incompletas, más de 100.000 empresas se han presentado a la prueba, y este número se acelera y se duplica con la actual apertura a toda la sociedad. Se entiende que dentro de las 24 horas posteriores a la apertura, Wenxin Yiyan respondió más de 33,42 millones de preguntas de los internautas.

Se puede decir que ya sea a nivel de producto o de servicio, el modelo grande de Qianfan proporciona a las empresas una interfaz de selección de modelos grandes abierta y compatible, donde las empresas pueden realizar la construcción de modelos grandes de extremo a extremo de 0 a 1, y también puede buscar una variedad de capacidades de la cadena de herramientas, incluida la anotación y el aviso de datos, y crear su propio modelo grande exclusivo con el costo y el umbral más bajos.

3. En la era de la IA, ¿qué tipo de modelo grande necesitamos?

Hoy en día, una propuesta que cada vez más personas están empezando a discutir es: en la era digital industrial actual, ¿qué tipo de modelo grande necesitamos? La respuesta de algunas personas es producto, la respuesta de otras es servicio y la respuesta de otras es seguridad de datos.

Una realidad común detrás de estas respuestas es que el modelo grande ya no es una pregunta de opción única, sino una pregunta integral. En esta nueva era, los productos, servicios, seguridad, apertura, etc. deben convertirse en necesidades, e incluso desde la perspectiva de la implementación empresarial, son solo necesidades.

Sin embargo, estas preguntas también están recibiendo respuesta.

Tomando a Baidu Smart Cloud como ejemplo, además de cooperar con empresas en el campo industrial, también ha creado conjuntamente más productos basados ​​en escenarios específicos con socios ecológicos. Por ejemplo, la infraestructura modelo a gran escala iSoftStone 2.0 creada con iSoftStone, el producto de aplicación de IA WAI construido conjuntamente con Weimob y los productos modelo a gran escala en el campo exclusivo desarrollados con Kingdee y Kingsoft Office.

Detrás de esta nueva batalla en equipo, los grandes modelos están apareciendo de manera más realista en varios escenarios industriales y diversas aplicaciones empresariales, no solo en finanzas y energía, sino también en grandes empresas estatales centrales . y cada vez más empresas a gran escala están dando el primer paso en la era de los modelos de IA a gran escala.

Además, desde una perspectiva más amplia también se puede ver claramente que la expresión real de estas industrias también está formando un nuevo volante de crecimiento para las empresas de gran escala en términos de productos e ingresos.

Según estadísticas incompletas, hasta ahora, hay 103 plantillas Prompt en la plataforma Baidu Smart Cloud Qianfan, incluidos más de diez escenarios como diálogo, programación, comercio electrónico, atención médica, juegos, traducción y discursos. Entre ellos se encuentran no solo las plantillas de aviso basadas en la acumulación de Baidu Smart Cloud en la práctica industrial, sino también las plantillas de aviso de los usuarios de alta frecuencia de Wenxin Yiyan. Es previsible que, como uno de los vínculos principales en la capacitación de modelos grandes, estas plantillas rápidas hagan que Qianfan sea más fácil de recibir por parte de las empresas y el mercado.

A nivel de informe financiero, según el informe financiero del segundo trimestre de 2023 publicado por Baidu, los ingresos de Baidu en el segundo trimestre fueron de 34,1 mil millones de yuanes para lograr un crecimiento acelerado y su beneficio neto aumentó un 44%. Además, según los datos del informe "Cuota de mercado de servicios de nube pública de IA de China de IDC, 2022", el mercado general de servicios de nube pública de IA de China en 2022 es de 7.970 millones de yuanes, de los cuales Baidu Smart Cloud representa el 28,9% y ocupa el primer lugar.

O se puede decir que, si bien el gran modelo de IA se está convirtiendo en una piedra de toque para varias empresas de infraestructura industrial, también se está convirtiendo en un nuevo motor.

El progreso continúa. El 5 de septiembre, Baidu Smart Cloud también anunciará cuatro medidas de apoyo en la Conferencia Baidu Yunzhi de 2023.

Según fuentes internas, en esta conferencia, Baidu Smart Cloud actualizará completamente la "Plataforma modelo a gran escala Qianfan", que cubrirá la infraestructura de potencia informática, cadenas de herramientas modelo a gran escala, conjuntos de datos de alta calidad y más. Además, lanzará soluciones industriales basadas en la reconstrucción del modelo a gran escala de Wenxin y también lanzará 10 productos de aplicaciones nativas de IA a nivel empresarial que cubren las tres áreas principales de marketing de servicios, mejora de la eficiencia de la oficina y optimización de la producción. Simultáneamente en la conferencia también se dará a conocer la política ecológica relacionada con el gran modelo.

Tal vez respondamos nuevamente a la pregunta anterior, es decir, "¿Qué tipo de modelo grande necesitamos?". Esta no es solo una propuesta para que las empresas encuentren la mejor opción, sino también para que las grandes empresas modelo anclen el futuro y el auto. -Pensamiento evidente a largo plazo.

Tal como dijo la persona relevante a cargo de Baidu en la entrevista: "Definitivamente habrá más productos de inteligencia artificial en el futuro. Tal vez estos productos no sean desarrollados por Baidu, pero las empresas pueden desarrollarlos basándose en Baidu Smart Cloud Qianfan. Esto es lo que Queremos y seguiremos haciéndolo”.

La respuesta ya está en camino.

*Li Liang es un seudónimo en el artículo.

Supongo que te gusta

Origin blog.csdn.net/chanyejiawang/article/details/132629175
Recomendado
Clasificación