[Special Express] Humano digital multimodal, modelo de medios multimodales y el impacto de la IA y AIGC en audio y video

  //  

Con el auge del contenido AIGC, los modelos de medios multimodales han entrado gradualmente en el campo de visión de todos, y el desarrollo de LLM les ha dado a las personas una nueva forma de pensar sobre las futuras herramientas de audio y video. El 29 de julio, LiveVideoStackCon2023 Shanghai Station AIGC y la sesión de producción de contenido reunirán los temas AIGC más populares y los compartirán con usted.


AIGC y producción de contenidos 

Impulsados ​​por la tecnología, la demanda y la cadena industrial, las personas también han entrado en la era emergente de producción de contenido de AIGC después de UGC y PGC. Pero AIGC no es una sola tecnología. Su esencia es una capacidad de producción de contenido de bajo umbral y alto grado de libertad formada mediante el uso de tecnología de empoderamiento de IA, y esta capacidad servirá a creadores y productores en varios escenarios.

TEMA 1 "Huawei Cloud MetaStudio introducción de desafíos y progreso humano digital multimodal"

Li Minglei Director técnico humano virtual digital de Huawei

Como maestros de las capacidades de IA, los humanos digitales involucran tecnologías como la visión por computadora, los gráficos por computadora, el procesamiento del habla y el procesamiento del lenguaje natural, y se utilizan cada vez más en campos como las finanzas, los asuntos gubernamentales, los medios y el comercio electrónico. Este informe presenta principalmente los principales avances de HUAWEI CLOUD en el campo del ser humano digital, incluida la conducción humana digital 2D, el modelado humano digital 3D, la vinculación, la conducción y la generación humana digital emocional. También presenta algunos desafíos en el campo del ser humano digital.


Este intercambio se dividirá en tres partes. La primera parte presenta la línea de producción y la planificación comercial del humano digital nativo de HUAWEI CLOUD; la segunda parte presenta el progreso de la tecnología humana digital 2D de HUAWEI CLOUD y cómo resolver el impulso de labios, la disposición del cuerpo , conducción de escena móvil y otros temas; la tercera parte presenta el progreso del modelado humano digital 3D HUAWEI CLOUD, encuadernación, conducción y otras tecnologías.

TEMA2 "Análisis de las herramientas de audio y video AIGC y pensar en futuras oportunidades de innovación"

Wang Wenyu-PPIO CTO y cofundador

¿Qué cambios traerán el modelo de lenguaje grande LLM y otros desarrollos tecnológicos AIGC a la industria de audio y video? Haré un balance de algunas muy buenas aplicaciones de AIGC que son populares en Silicon Valley, y luego pensaré en tecnología + negocios, y analizaré las oportunidades de innovación y emprendimiento en el futuro del audio y el video combinados con AIGC.

Esquema del discurso:

1. AIGC ha traído diez veces cambios a toda la industria 2. Haga un balance de varias aplicaciones de AIGC en Silicon Valley 3.
Piense en la naturaleza de AIGC y la conexión de audio y video 4. ¿Dónde están las oportunidades futuras para la innovación y emprendimiento en la industria del audio y video

 TEMA 3 "IA redefine el "nuevo paradigma" de la productividad de audio y video"

Wu Lei, vicepresidente de Wangxin Technology

Marco principal: 1. Frente a la nueva era de la Ley de Moore, el impacto de la tecnología de IA en el contenido de audio y video 2. La innovación de la IA en la productividad de audio y video, ¿qué tipo de infraestructura y plataforma de potencia informática necesita construir? 3. Aplicación inteligente de IA y práctica de construcción.

 TEMA 4 "De AIGC al modelo de medios multimodales"

Song Li-Profesor de la Universidad Jiaotong de Shanghai

Este discurso demostrará las características de la nueva generación de medios multimodales y la nueva tendencia de codificación intermodal inteligente basada en modelos grandes en los tres aspectos de generación de medios multimodales, codificación de medios multimodales e interacción de medios multimodales.


d8af061d5d81ac90f276f7415a78373e.pngEscanee el código QR en la imagen o haga clic en " Leer el texto original " 

Vea más temas interesantes de LiveVideoStackCon 2023 Shanghai Station

Supongo que te gusta

Origin blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/131820418
Recomendado
Clasificación