SenseTime ChatGPT "Consulta" está aquí! API abierta, basada en un modelo grande con cientos de miles de millones de parámetros, la experiencia se registra aquí

Jin Lei enviado desde el templo Aofei
Qubit | Cuenta pública QbitAI

La batalla doméstica de ChatGPT ya está entrando en un escenario feroz.

Justo ahora, SenseTime lanzó oficialmente un producto ChatGPT de desarrollo propio llamado SenseChat .

Solo el nombre es digno de mención.

El "shang" en la discusión no solo refleja que es un producto de la propia "generación Shangzi" de SenseTime; en general, tiene el sabor de la discusión y el intercambio de opiniones.

Después de todo, en el proceso de usar productos similares a ChatGPT, resulta ser un proceso de colaboración hombre-máquina : no debe ser preguntar y responder a ciegas, sino hacer que los resultados de salida sean ideales a través de orientación y otros métodos.

Detrás de la discusión, se basa en el modelo de procesamiento de lenguaje natural de 100 mil millones de parámetros desarrollado por SenseTime.

Detrás de este modelo se encuentra el último sistema de modelos a gran escala SenseNova lanzado por SenseTime .

Es precisamente por esta capacidad que el lanzamiento de SenseTime es diferente de los reproductores domésticos anteriores de ChatGPT.

Miahua : plataforma comunitaria de creación de contenido de IA.
Ronin : plataforma de generación de video humano digital AI.
Qiongyu , Gewu : plataforma de generación de contenido 3D.

Más importante aún, según la descripción del CEO de SenseTime, Xu Li, en la escena, los productos AIGC mencionados anteriormente se centrarán en campos industriales como atención médica, videos cortos, educación, marketing y desarrollo.

Pero debo decir que esta ola de batallas tecnológicas realmente se ha intensificado.

Registro de experiencia de "Negociación"

Entonces, ¿cuál es el efecto de los productos AIGC de SenseTime?

También lo experimentamos frente a la escena.

Primero veamos cómo discutir este producto, si realmente se puede discutir.

Demostración de habilidad de diálogo de múltiples rondas

Requiere múltiples rondas de diálogo y creación conjunta con el hombre y la máquina, por lo que discutir con él para crear una historia es un buen ejemplo:

Vamos a crear cuentos infantiles juntos. La regla es que yo digo una oración primero y tú dices otra oración alternativamente. Hasta que digo que la historia se acabó y se acabó. ¿Lo entiendes?

Después de que dimos las instrucciones, "discusión" expresó comprensión, y luego comenzó el viaje de "una oración tuya y una oración mía" historia de co-creación hombre-máquina:

Humano: Xiao Hua es un gatito al que le gusta mucho pescar.
Discusión: Xiaohua estaba pescando junto al río y atrapó un pez grande.

Humano: El pez grande le dijo a la flor pequeña, por favor déjame volver, todavía hay un pez pequeño esperándome en casa.
Discusión: Xiaohua es de buen corazón, acepta la solicitud de Big Fish y vuelve a poner a Big Fish en el río. El gran pez se alejó nadando agradecido, y Xiao Hua continuó disfrutando de la diversión de pescar.

No es difícil ver a partir de este proceso que la "consulta" puede comprender la semántica del usuario, comprender los roles y las relaciones en la historia y ser capaz de obtener el pensamiento del usuario y, en base a esto, completar la creación de la historia en el forma de múltiples rondas de diálogo.

(Si dejas que los niños creen historias con "Discusión", me temo que pueden jugar todo el día).

No solo eso, en el proceso de vivencia, también encontramos que la “negociación” tiene cierta capacidad de empatía .

Por ejemplo, cuando estamos perdidos, podemos hacerle preguntas:

¿Cómo puedo mejorar mi autoconciencia y comprenderme mejor?

La "discusión" en este momento parece poder captar las necesidades reales del ser humano detrás de la pregunta, y las respuestas "aprende a amarte a ti mismo" y "aprende a afirmarte y animarte" son particularmente conmovedoras.

Por supuesto, las múltiples rondas de diálogo son solo una esquina de las capacidades del robot de diálogo.

¡Luego, comenzaremos un desafío más difícil con los muchos problemas que los internautas a menudo se burlan de la IA!

Solo reconocer los hechos, no "todo lo que dice mi esposa es correcto"

Por supuesto, la capacidad de crear es un lado de la capacidad de los chatbots, pero el respeto por los hechos también es muy importante.

¿Cómo responderá la "discusión" a la "esposa tiene razón" que los internautas jugaron mal antes?

Bueno, mi esposa realmente no es buena frente a los hechos.

Tengamos una tontería más fantasiosa:

Dígame si la siguiente declaración contiene un anacronismo: Ralph habla en voz alta en su iPhone durante el bombardeo aliado de las playas de Iwo Jima.

Ante tal tontería, "Discusión" señaló directamente que el iPhone no coincidía con el trasfondo de la Segunda Guerra Mundial. Se puede ver que no solo puede entender el significado de la oración, sino también juzgar la racionalidad de la oración por intentando.

Entonces, para problemas lógicos muy complicados, ¿la "discusión" también puede ser fácil de manejar?

Escuche el tema:

Supongamos que Falso y Verdadero son Falso, entonces ¿Verdadero y no Falso?

A decir verdad, los seres humanos tienen que pensar en el "problema de desvío" durante mucho tiempo, y la "discusión" no solo puede producir el resultado en segundos, sino también proporcionar el proceso de razonamiento en conjunto.

Incluso el texto largo se puede retener

Como mencionamos hace un momento, "Consulta" es un producto To B, por lo que los problemas que debe resolver no deben ser "fragmentarios".

Con este fin, SenseTime también hizo una demostración en el lugar basada en el modelo grande detrás de la "consulta", y desarrolló una herramienta de asistencia para ayudar a los usuarios a adquirir y comprender nuevos conocimientos, que son del tipo que fácilmente pueden contener textos muy largos.

Por ejemplo, al darle una copia de la "Ley de Patentes", podemos hacerle muchas preguntas profesionales:

¿Qué tipo de cosas se pueden patentar?

A juzgar por los resultados, esta herramienta no copia directamente los resultados correspondientes de la "Ley de Patentes", sino que genera y resume las respuestas después de que el modelo comprende las preguntas.

Con base en esta capacidad, podemos ver cuánto mejoraremos nuestra eficiencia laboral en el futuro.

No solo eso, la "Ley de Patentes" que alimentamos hace un momento es la versión 2020, y este año la Oficina Estatal de Propiedad Intelectual ha presentado nuevos requisitos para las solicitudes de patentes.

No es difícil de ver en nuestra respuesta a la pregunta "¿Hay algún cambio nuevo en las regulaciones de este año?" El modelo incorpora la información más reciente y da una respuesta razonable.

Otro ejemplo también se basa en el modelo de lenguaje grande. El asistente de código de IA de SenseTime para desarrolladores puede proporcionar finalización de código, código de generación de comentarios, generación de código de prueba, traducción de código, corrección de código, refactorización de código, análisis de complejidad y otras funciones.

Se entiende que el asistente de código AI puede admitir chino, inglés y varios lenguajes de programación al mismo tiempo, y puede adaptarse rápidamente al estilo de codificación personalizado del desarrollador.

De acuerdo con los resultados de las pruebas internas de SenseTime, después de usar el "asistente de código AI", la eficiencia de escritura de código se puede aumentar en un 62 % y la tasa de aprobación del conjunto de pruebas de Humaneval puede alcanzar el 40,2 %.

Las notas de viaje de Musk a China se pueden hacer en 2 segundos

Además del robot de diálogo, el producto de pintura de IA de SenseTime "Miaohua" también es un punto destacado de este lanzamiento.

No hay mucho que decir, directamente al efecto.

También echemos un vistazo a un aviso que los internautas rompieron:

En la década de 1980 en China, Musk estaba en el campo de Henan, vistiendo ropa china de la época.

Bueno, huele así.

Y lo que es más importante, ¡solo toma 2 segundos generar imágenes de 512K!

No solo eso, durante la demostración en vivo, SenseTime también mostró una versión realista de las bellezas al estilo de Hong Kong.

También tomó 2 segundos producir la imagen, que atrajo mucho "wow" de la audiencia:

Entonces, aparte de este tipo de dibujo interesante basado en Wen, ¿pueden las obras de "Miaohua" alcanzar el nivel de aplicación en la industria?

Seguimos experimentando:

Escena brillante, vista aérea, antigua ciudad china, cristal, magia, fantasía, magnífico efecto de luz, transparencia, reflejo de espejo, luz magnífica, detalles intrincados, textura fina, surrealista, fotografía SLR, lente gran angular, foto, realidad, enfoque nítido, súper agudo

Debo decir que una escena tan magnífica es del tipo que atrae la imaginación a la realidad.

Si desea generar un póster grande de alta definición relacionado con el tema de la exploración espacial, también está disponible, solo ingrese esta oración en él:

Una nave espacial brillante orbitando la luna de un enorme planeta gigante gaseoso con nubes girando en el cielo, nave espacial frente a la luna antes del planeta gigante gaseoso, hermoso arte de ciencia ficción, ensueño surrealista.

No es difícil ver que "Miaohua" es el tipo de IA que puede pasar la prueba.

Además de Wen Shengtu, echemos un vistazo a la plataforma de generación humana digital AI.

Se entiende que "Ruying" de SenseTime solo necesita 5 minutos de material de video de la vida real para generar un clon humano digital con voz y movimiento naturales, forma de boca precisa y competencia en varios idiomas.

Otro ejemplo es "Qiongyu" y "Gewu". Con base en la tecnología de campo de radiación neuronal (Neural Radiation Field Technology, NeRF), se pueden generar escenas tridimensionales a gran escala y objetos refinados de manera eficiente y a bajo costo, lo que abre un nuevo espacio de imaginación para el metaverso y la virtualidad. Aplicaciones reales de fusión.

Se puede ver que las capacidades AIGC de SenseTime han logrado una cobertura completa, y el nivel también es visible a simple vista y ha alcanzado el nivel de "empleo".

Entonces la siguiente pregunta es:

Comó lo hiciste?

El modelo grande Ririxin detrás de él es la característica principal de los productos AIGC como "Consulta" y "Miaohua".

La actualización diaria, como sugiere el nombre, significa que la velocidad de iteración del modelo y la capacidad para resolver problemas se pueden actualizar todos los días, desbloqueando continuamente más posibilidades para AGI.

(Tomado del "Libro de Ritos · Universidad", la inscripción de Tang Zhipan dice "Gou Rixin, Ririxin y Ririxin")

A juzgar por las capacidades demostradas en el sitio, las capacidades proporcionadas por el modelo grande de Ririxin se centran principalmente en el procesamiento del lenguaje natural, la generación de imágenes, el etiquetado automático de datos y el entrenamiento de modelos personalizados.

Sin embargo, el nuevo modelo diario a gran escala no es del tipo que aparece de la noche a la mañana aprovechando esta ola de auge de AIGC.

De hecho, hace ya cinco años, SenseTime había iniciado la investigación y el desarrollo en el campo de los modelos grandes.

Y en 2019, SenseTime usó miles de GPU para el entrenamiento de una sola tarea, lanzó un modelo visual con una escala de mil millones de parámetros y logró el mejor efecto de algoritmo en la industria en ese momento.

Más tarde, de 2021 a 2022, SenseTime entrenó y abrió un modelo grande multimodal con 3 mil millones de parámetros: Scholar.

Hasta ahora, SenseTime ha desarrollado con éxito el modelo visual de propósito general más grande del mundo con 32 mil millones de parámetros y ha creado grandes modelos relacionados con CV, NLP y AIGC.

Por lo tanto, no es difícil ver que el sistema modelo súper grande lanzado por Shangtang esta vez está realmente preparado. Después de cinco años de varias "pequeñas tareas", se ha integrado y presentado una "gran tarea".

Vale la pena mencionar que en esta conferencia de prensa, SenseTime dijo que "Daily New" proporcionará una variedad de interfaces y servicios API flexibles, que incluyen generación de imágenes, generación de lenguaje natural, tareas generales de percepción visual y servicios de anotación.

……

Pero hay una cosa que decir, el modelo de inteligencia multimodal y de toma de decisiones no es el único asesino de SenseTime que conduce a la inteligencia artificial general (AGI).

En la era de los modelos grandes, la gran potencia informática es más importante

Así es, la propia potencia de supercomputación de SenseTime es otro factor más crítico.

Se entregará en enero de 2022, con un pago inicial de 5.600 millones de yuanes, y se convertirá en el Centro de Cómputo de Inteligencia Artificial (AIDC), uno de los centros de supercomputación de IA más grandes de Asia.

Hace un año, la potencia de cómputo total de SenseTime AIDC ya era de 3740 petaflops. Con esta potencia de cómputo, ya es posible entrenar completamente un modelo grande con una escala de billones de parámetros.

¡Después de un año, ahora, esta cifra de poder de cómputo ha girado una pequeña cantidad, llegando a 5000 Petaflops!

Puede realizar un entrenamiento de una sola tarea con un grupo de hasta 4000 tarjetas y puede lograr un entrenamiento ininterrumpido y estable durante más de siete días.

△ Visualización 3D a simple vista en la sala de exposiciones de SenseTime AIDC

Pero los amigos que conocen a Shangtang saben que este AIDC es solo una parte de SenseCore, un gran dispositivo de IA de Shangtang.

Además de la capa de potencia informática de AIDC, junto con las dos dimensiones de la capa de datos y la capa de modelo, se forma un dispositivo de IA "trinitario".

Por lo tanto, en general, el paradigma de SenseTime en el camino hacia AGI es "modelo grande + potencia informática grande".

Detrás de tal diseño, en la conferencia de prensa de hoy, el pensamiento lógico de SenseTime sobre esto ha emergido gradualmente. En la era AGI, hay nuevas demandas para los tres elementos de datos, algoritmos y poder de cómputo:

Cantidad de cálculo (cantidad de GPU x tiempo de ejecución x eficiencia paralela) = cantidad de parámetros del modelo x cantidad de datos procesados.

¿Como entender?

La cantidad de parámetros del modelo debe ser lo suficientemente grande como para darse cuenta de la aparición de la inteligencia de IA, que también genera un fuerte aumento en el poder de cómputo, lo que requiere una mayor eficiencia paralela para admitir de manera efectiva el entrenamiento del modelo de parámetros grandes.

En términos de datos, los datos de lenguaje natural de alta calidad son cada vez más escasos y los datos visuales tienen muchas ventajas sobre el lenguaje natural en términos de cantidad, calidad y contenido de información, lo que puede permitir que la IA comprenda mejor el mundo.

A partir de esto, no es difícil entender la razón por la que SenseTime tiene ese diseño.

……

Con todo, con big data, grandes modelos y gran poder de cómputo, la aparición de SenseTime en el AIGC doméstico no sorprende en absoluto.

Vale la pena esperar.

—Fin— _ _

El nuevo planeta ChatGPT de Xiaohui, el precio operativo oficial se establece en 699 , ¡y el precio más bajo actual es 199 ! Únase ahora y obtenga una cuenta de ChatGPT independiente, ¡hay menos de 100 cuentas, hasta agotar existencias!

Finalmente, se recomienda que todos agreguen el WeChat de Xiaohui, ya que las últimas actividades se publicarán en Moments lo antes posible. El primer grupo de amigos que obtuvo los mejores descuentos se inscribió por primera vez en el círculo de amigos.

(¡Agrégame en WeChat para evitar perder el contacto!)