https://mp.weixin.qq.com/s/NXGSLylqaItkcCmfUBbIuA

By 超神经

在 1 月 28 日的 2019 网络春晚上，AI 虚拟主持人登台主持节目，撒贝宁作为与 AI 替身同台的主持人之一，当场宣布准备准备「隐退」， AI 取代主持人的时刻真的来临了吗？

En la Noche de Primavera de Internet de este año, aparecieron por primera vez cuatro anfitriones de imágenes virtuales, basados en la aparición de Sa Beining, Zhu Xun, Gao Bo y Long Yang. Los cuatro anfitriones se alojaron todos en el mismo escenario que su anfitrión virtual, lo que realmente añadió mucha diversión a la fiesta.

Xiaosa de boca rápida está casi fuera de línea frente a AI Xiaosa

Se puede ver en el video que hay una gran similitud entre el host virtual de IA y la entidad. Además de no perder humanos al contestar y agitar el teléfono, también existe el lenguaje corporal correspondiente, y cada host virtual tiene un Las características de la expresión.

Que es un host virtual

Según los informes, esta vez el anfitrión virtual de la Gala del Festival de Primavera de Internet es ObEN a través de la reconstrucción de imágenes en 3D y la tecnología de simulación de sonido electrónico para construir una imagen virtual, creando una imagen virtual de inteligencia artificial personalizada-PAI (Personal AI) ).

Además del anfitrión virtual de esta Gala del Festival de Primavera en línea, ObEN también cooperó con celebridades y compañías estrella. SM Corporation, la empresa de entretenimiento más grande de Corea, es uno de los primeros inversores ángeles de ObEN.

En junio de 2017, ObEN cooperó con SM Entertainment Company de Corea del Sur para establecer la primera compañía de derechos de autor estrella de inteligencia artificial del mundo, AI Star, en Hong Kong, que se llama Magic Star en chino, para crear un ídolo virtual. El grupo de ídolos femeninos domésticos SNH48 también anunció una colaboración con ObEN para crear una imagen exclusiva de inteligencia artificial.

En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo

La tecnología central de este producto se basa principalmente en tres aspectos:

Primero, es el establecimiento de una imagen visual. Usando fotos del cuerpo del anfitrión, usando escáneres 3D, 3DS MAX, MAYA y otras herramientas de modelado 3D, permita que AI construya un modelo de algoritmo y finalmente construya una forma de cara y cuerpo al comprender la relación entre la distribución del color de la foto y la profundidad de la estructura.

El segundo es la síntesis de sonido. La tecnología de voz de IA que utilizan no requiere una gran colección de bibliotecas de voz, solo una docena de oraciones de grabación de voz, y el establecimiento de un modelo de voz se puede lograr mediante métodos como la extracción de parámetros de características y el aprendizaje por transferencia.

Finalmente, haga que el host virtual sea lo más realista posible. Esto no solo requiere imágenes que coincidan con sus sonidos, sino que también debe personalizarlos. A través de sensores y equipos de seguimiento de movimiento, combinados con IA y entrenamiento de captura de movimiento, el anfitrión virtual puede simular el lenguaje hablado, las expresiones faciales, los gestos, los movimientos corporales y las interacciones de la escena de acuerdo con el cuerpo correspondiente.

Aunque esta es la primera vez que AI ha alojado un crossover, realmente hay muchas apariciones en el mundo del ancla virtual de AI.

El primer presentador chino de noticias de IA

En la Quinta Conferencia de Internet celebrada en noviembre de 2018, la Agencia de Noticias Xinhua mostró a uno de sus nuevos reporteros. Este es el primer presentador de noticias de síntesis virtual de IA. Qiu Hao, el prototipo de IA, dijo: "Imagen Es mi imagen, y el sonido se adapta a mi voz, pero nunca dije las palabras que se transmitieron ... "

En este video, podemos ver al presentador en el video, presentándose en su acento, con la voz, su rostro y labios tienen movimientos correspondientes. Tengo que decir que hay sorpresas, pero todavía hay algunas decepciones. En comparación con los anclajes activos, la gente puede darse cuenta de un vistazo que es un producto de la mecanización. La forma en que funciona requiere que los humanos escriban comunicados de prensa.

Este soporte co-técnico proviene de la "tecnología de clonación" de Sogou. La clave de esta tecnología es la síntesis de voz y la generación de imágenes.

En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo

La tecnología de síntesis de voz puede utilizar una pequeña cantidad de datos de audio para permitir que el modelo de la máquina aprenda las características de habla del objeto de entrada, capte el timbre, el ritmo, la emoción y otros aspectos, y finalmente se dé cuenta de la información de audio del texto de entrada.

La generación de imágenes utiliza el aprendizaje y la construcción del reconocimiento facial, la reconstrucción facial tridimensional, el modelado de expresiones, etc., y finalmente logra la correspondencia entre el audio de salida y la información visual de salida.

Independientemente de esas máquinas tragamonedas, el mayor punto publicitario de esta tecnología es que puede realizar la función de clonación en la pantalla, que probablemente es que puedes usar el televisor, la tableta y el teléfono móvil para ver a una persona transmitiendo tres contenidos diferentes al mismo tiempo.

Neon Country no solo construye Hatsune, sino que también construye anclas

Japón había informado anteriormente y también se han hecho sus anclas de inteligencia artificial.

En abril del año pasado, en un programa llamado "NEWS CHECK 11" en NHK TV, el presentador era un simpático presentador de IA de dibujos animados: "Presentador de noticias Yomiko".
En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo

Este ancla está hecha con tecnología CG, aprende a dividirse en fonemas a partir de una gran cantidad de grabaciones, luego aprende a reconocer y leer texto y finalmente lee noticias.

Además, también se han realizado robots como presentadores de noticias.

El robot de belleza "Elika" desarrollado por la Universidad de Osaka y la Universidad de Kyoto también sirvió como presentador de noticias de la estación de televisión NNN de Japón en abril de 2018.

"Elika" está ambientada como una hermosa niña de 23 años. Se le da un rostro femenino estándar. La voz de "Elika" se sintetiza en base a la grabación de los actores de voz, lo que se puede llamar muy natural.

En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo

Además, también cuenta con un avanzado sistema de diálogo que, al hablar con la gente, recopila información a través de micrófonos y sensores, percibe la voz y las acciones de la otra parte, y luego se vuelve hacia la otra parte y mantiene una conversación fluida.

Sus ojos, boca, cuello y otros 19 lugares se pueden mover con la presión del aire, mostrando una variedad de expresiones, y también pueden hacer algunos movimientos simples, vívidamente.

¿Cuándo se reemplazará el host?

Hablando de la Gala del Festival de Primavera de Internet, la aparición de los cuatro traviesos anfitriones virtuales ha recibido mucha atención, y se puede ver en la actitud de la audiencia que les tienen mucho cariño.

Entonces, ¿serán una oportunidad para que el anfitrión sea despedido? Quizás ni Xiaosa ni Xiao Xiaosa estarían de acuerdo.

En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo
"Escenario de despedida de Xiao Sa"

En cuanto al acento de la transmisión de noticias de IA y las expresiones faciales inconsistentes, todavía hay margen de mejora. Los robots de transmisión de noticias en vivo de Japón no reemplazaron a la industria local de noticias a gran escala. A lo sumo, todavía se encuentran en el nivel de auxiliares y novedosos.

Entonces, mirándolo de esta manera, el progreso tecnológico nos ha traído una experiencia nueva y hermosa, pero tal vez en una era así, los trucos van más rápido de lo que realmente son.

Quizás el día en que sea reemplazado llegará eventualmente, pero ciertamente no es hoy. Deberíamos creer que cuando llegue ese día, es posible que los humanos hayan resuelto la forma de llevarse bien con la IA. Durante el Festival de Primavera en ese momento, veremos no solo a IA como anfitriona de la Gala del Festival de Primavera, sino también actuaciones de IA.

Nosotros, solo esperamos a que la IA nos alimente con la boca abierta.
En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo

Enciclopedia súper nerviosa

Transferir aprendizaje

El aprendizaje por transferencia es un método de utilizar el conocimiento existente para aprender nuevos conocimientos.

En el aprendizaje por transferencia, el conocimiento existente se denomina dominio de origen y el nuevo conocimiento que se debe aprender se denomina dominio de destino.

El propósito del aprendizaje sobre migración es extraer conocimiento y experiencia de una o más tareas de origen y luego aplicarlo a un dominio de destino.

Métodos básicos de transferencia de aprendizaje

1) La migración de muestra
encuentra datos similares al dominio de destino en el dominio de origen y ajusta el peso de estos datos para que los nuevos datos coincidan con los del dominio de destino.

2) La migración del modelo
asume que el dominio de origen y el dominio de destino comparten parámetros del modelo, lo que significa que un modelo que ha sido entrenado en el dominio de origen a través de una gran cantidad de datos se aplica al dominio de destino para la predicción.

3) Migración de relaciones
Suponiendo que dos dominios son similares, compartirán una cierta relación de similitud, y la relación de red lógica en el dominio de origen se aplica al dominio de destino para la migración.

En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo

En la futura Gala del Festival de Primavera, es posible que no necesite un anfitrión en vivo

Que es un host virtual

El primer presentador chino de noticias de IA

Neon Country no solo construye Hatsune, sino que también construye anclas

¿Cuándo se reemplazará el host?

Enciclopedia súper nerviosa

Supongo que te gusta