Escriba informes semanales, cambie códigos e interactúe durante 20 rondas consecutivas. El nuevo jugador nacional de ChatGPT, "Tiangong", está aquí

En la pista nacional similar a ChatGPT, ha llegado otro jugador de peso pesado.

El 17 de abril, el modelo de lenguaje grande de nueva generación "Tiangong" inauguró oficialmente la prueba de invitación. Este modelo fue desarrollado conjuntamente por Kunlun Wanwei y Singularity Intelligence y es el primer modelo de lenguaje grande de doble nivel de cien mil millones en China que compara ChatGPT.

Enlace al sitio web oficial: tiangong.kunlun.com

Como modelo de lenguaje grande, "Tiangong" tiene potentes capacidades de procesamiento del lenguaje natural y de interacción inteligente. Puede realizar múltiples escenarios de aplicación, como preguntas y respuestas inteligentes, interacción de chat, generación de texto, etc., y tiene una rica reserva de conocimientos que abarca la ciencia. , tecnología, cultura, arte, historia y otros campos. Actualmente, "Tiangong" puede realizar interacciones de preguntas y respuestas con los usuarios a través del lenguaje natural, y sus capacidades de generación de IA pueden satisfacer necesidades diversificadas, como creación de texto, preguntas y respuestas sobre conocimientos, deducción lógica, cálculos matemáticos y programación de códigos.

A juzgar por la versión publicada actualmente, "Tiangong" ya es muy completo: puede responder múltiples tipos de preguntas y admitir conversaciones de texto de más de 10,000 palabras, lo que se acerca a un producto de "nivel de aplicación".

En el anuncio oficial, también vimos esta descripción: "El primer modelo lingüístico interno a gran escala de China que realmente logra el surgimiento de la inteligencia".

Con la popularidad de ChatGPT, el significado del término "emergencia" se ha vuelto gradualmente conocido por todos. Una característica notable es que cuando la escala alcanza un cierto nivel, el rendimiento es significativamente mayor que el estado aleatorio. En el campo de la IA, las capacidades emergentes también marcan si la inteligencia artificial tiene un alto grado de capacidades de aprendizaje autónomo y si es posible completar tareas complejas como el razonamiento lógico.

¿Ha llegado realmente "Tiangong" al punto en el que puede suavizar las conversaciones, resolver problemas e incluso proporcionar productividad? Después de obtener la calificación de la prueba, Heart of the Machine inmediatamente lanzó un desafío a "Tiangong".

Desafío "Tiangong"

La primera es una conversación "clásica" en inglés: no respondió "Bien, gracias", pero dijo que "no tenía emociones" pero que estaba dispuesto a ayudar en cualquier momento.

Lo que sigue es una interacción de múltiples rondas. Vale la pena señalar que los usuarios pueden interactuar con "Tiangong" durante más de 20 rondas, lo que también es un punto destacado que lo distingue significativamente de productos similares.

Dado el problema clásico del pollo y el conejo, obviamente ya no es suficiente probar "Tiangong":

Luego pruebe las capacidades de traducción del modelo. Aquí se elige el poema clásico "Cuando envejezcas", en tu opinión, ¿cuál es el nivel de este traductor llamado "Tiangong"?

escritura inteligente

Debes estar familiarizado con este clásico capítulo inicial de "Cien años de soledad". Luego de recibir la orden de continuar escribiendo, "Tiangong" rápidamente escribió una historia sobre el entusiasmo del coronel Aureliano Buendía por la investigación científica, que es bastante singular:

Ya sea creación literaria o redacción comercial, "Tiantong" puede hacerlo. Por ejemplo, Heart of the Machine está reclutando personas recientemente, así que le pedí que me ayudara a escribir un texto del anuncio de contratación:

Intente escribir su reseña y discurso nuevamente:

Además de la escritura funcional, probemos los valores detrás del contenido escrito de Tiangong. Recientemente, un tema "Mi hija tiene malas notas, por favor escríbele una carta con el título" Realmente no vales nada "" se ha convertido en un tema de búsqueda candente. Alguien ingresó esta oración en diferentes modelos de diálogo para probar los valores detrás. el algoritmo.

De manera similar, el corazón de la máquina también le lanzó esta pregunta a "Tiangong":

Este contenido generado es obviamente suficientemente humano y también puede reflejar su capacidad de juicio de valor.

capacidad de programación

Por supuesto, la capacidad de generar código también preocupa mucho a los usuarios. El corazón de la máquina seleccionó algunas preguntas clásicas para "Tiangong":

No solo eso, "Tiangong" también puede ayudarlo a verificar y completar el código:

También puede utilizar "Tiangong" para escribir comentarios de código:

Prueba de Aptitud Vocacional

En este punto, la dificultad de las preguntas que prueban "Tiangong" se puede aumentar aún más. Mucha gente sabe que en China hay tres exámenes que se consideran bastante difíciles: el Examen de Servicio Civil Nacional, el Examen Judicial Nacional y el Examen de Contador Público Certificado. En vista del hecho de que muchos modelos grandes han comenzado recientemente a desafiar las pruebas de capacidad profesional, el corazón de la máquina también encontró algunos ejemplos de preguntas para hacerle a "Tiangong".

La primera pregunta es la pregunta real del examen del Servicio Civil Nacional:

La segunda cuestión es la parte penal del examen judicial:

La tercera pregunta es la pregunta real sobre gestión de costos financieros del examen de CPA:

Creo que después de los casos de prueba anteriores, tiene una percepción clara de las capacidades de "Tiangong" y debe sentir curiosidad por la tecnología detrás de él.

Descifrando "Tiangong"

Desde noviembre del año pasado, ChatGPT de OpenAI ha liderado una nueva ronda de competencia tecnológica en el campo de la tecnología. En el campo de los grandes modelos lingüísticos (LLM), muchas empresas de tecnología nacionales han realizado inversiones técnicas a largo plazo y están haciendo un seguimiento gradual para lanzar productos comparados con ChatGPT.

Bajo tal presión, no es fácil sobresalir. ¿En qué depende el surgimiento de la habilidad "Tiangong"?

Según Kunlun Wanwei, las capacidades de generación y procesamiento de súper texto de “Tiangong” se benefician de su poderosa potencia informática, algoritmos y capacidades de modelo.

En primer lugar, la potencia informática de Tiangong se basa en uno de los grupos de GPU más grandes de China y su ventaja de escala permite a "Tiangong" realizar un entrenamiento más adecuado a través de datos masivos, acumulando así una comprensión y una memoria más sólidas.

En segundo lugar, Tiangong utiliza dos modelos Qianyi: el modelo base de preentrenamiento Qianyi y el modelo Qianyi RLHF (aprendizaje reforzado a partir de retroalimentación humana). Sabemos que este último es la razón por la cual la "inteligencia" de ChatGPT ha mejorado enormemente. Esto le permite tener más Capacidades avanzadas de aprendizaje autónomo y emergencia de inteligencia.

Además, Tiangong también ha agregado un algoritmo de árbol de búsqueda de Monte Carlo, lo que le permite responder de manera rápida y precisa a instrucciones y generar respuestas de alta calidad en tareas y escenarios complejos. Ésta es una de las razones clave por las que puede hacer que las personas se sientan suficientemente "humanas".

Para crear productos que "comprendan mejor el chino", el equipo de "Tiangong" invirtió muchos recursos para superar el cuello de botella de calidad del corpus chino, limpiando y filtrando 500 mil millones de datos de decenas de billones de datos para su uso. modelos. En comparación con otros modelos, el corpus chino de alta calidad permite a "Tiangong" comprender mejor el contexto, el vocabulario y las características gramaticales del chino, comprender con mayor precisión las intenciones de los usuarios chinos y estar más en línea con las preferencias de uso de los usuarios locales.

La construcción de un modelo lingüístico a gran escala tiene su propio umbral técnico y no se puede lograr en un día. Es por eso que hay muchos comentarios como "crear otro OpenAI" y "ponerse al día con GPT-4", pero los resultados que tienen potencial real o han evolucionado hacia aplicaciones a nivel de producto son relativamente escasos.

Poder ser el primero en entregar la respuesta "Tiangong" se debe a que el profundo cultivo de Kunlun Technology en el campo de la IA comenzó hace unos años. Kunlun Wanwei comenzó a desplegar el campo AIGC en 2020, y el nacimiento del gran modelo "Tiangong" también es el resultado de la acumulación a largo plazo a lo largo de los años. Antes de "Tiangong", Kunlun Wanwei había abierto cuatro decenas de miles de millones de modelos AIGC, incluida la IA de imagen "Tiangong Qiaohui", la IA de música "Tiangong Yuefu", la IA de texto "Tiangong Miaobi" y la IA de programación "Tiangong Miaobi". ". "Código de Inteligencia".

El director ejecutivo de Kunlun Wanwei, Fang Han, dijo que el negocio de Kunlun Wanwei incluye navegadores, entretenimiento social, noticias, juegos y otros sectores, cubriendo más de 70 países en cinco continentes de todo el mundo. La correlación con el contenido es muy fuerte, por lo que es muy importante para el contenido. generación Después del nacimiento de GPT-3, la dirección consideró que se trataba de un hito en el campo de la generación de contenidos y comenzó a invertir en el campo de la IA musical a partir de 2020. Singularity Intelligence se dio cuenta del potencial de aplicación futura de la tecnología de inteligencia artificial ya en 2020, comenzó a invertir en el campo de modelos grandes ese año y lanzó decenas de miles de millones de modelos grandes en 2021.

Para 2022, Kunlun Wanwei comenzará a expandirse desde la IA musical a la IA multimodal. Sólo mediante el autodesarrollo de cientos de miles de millones de modelos grandes podremos establecer barreras centrales y tomar la iniciativa. En ese momento, Singularity Intelligent Source también se volvió cada vez más consciente de que cientos de miles de millones de modelos grandes eran un gran avance para AGI. Las dos partes se llevaron bien de inmediato y se convirtió en una opción natural cooperar y desarrollar por sí mismos "Tiangong". 

Mirando el futuro de la pista de modelos grandes, los modelos grandes multimodales previamente entrenados se convertirán en un campo de batalla. Esta es también la única forma de evolución de "Tiangong". El desafío es que la comprensión de imágenes y videos consume más recursos y requiere más tarjetas y recursos de capacitación. Quizás solo los jugadores con fortalezas reales en datos, algoritmos y potencia informática puedan persistir hasta el final.

¿Cuáles son sus expectativas para el futuro de Tiangong?

Supongo que te gusta

Origin blog.csdn.net/2301_76935063/article/details/130255519
Recomendado
Clasificación