Pensamiento de potencia informática de GPU "Special Express", práctica de tecnología de producción de contenido, animación de IA, marco de composición controlable multimodal



En la era AIGC, con el poder de la inteligencia artificial, los creadores de audio y vídeo pueden realizar más fácilmente sus ideas creativas. La tecnología de inteligencia artificial no solo puede proporcionar edición de audio y video de alta calidad y procesamiento de efectos especiales, sino también recomendar materiales de manera inteligente de acuerdo con las necesidades del usuario, ajustar efectos de audio, generar efectos visuales e incluso agregar comentarios interesantes a los videos a través de tecnología de procesamiento de lenguaje natural.


A través de AIGC, marcamos el comienzo de una era de creación de audio y vídeo llena de posibilidades. Los creadores y productores pueden utilizar el poder de la IA para crear obras de audio y video más creativas e imaginativas para satisfacer las demandas cambiantes del mercado y promover el desarrollo sostenible y la innovación de toda la cadena de la industria del audio y el video.



01

Reflexiones fundamentales del AIGC sobre la filosofía de la potencia informática: sobre el pasado, el presente y el futuro de la GPU




Wang Wenyu 

Cofundador y CTO de PPIO Pai Ouyun


Actualmente, la GPU se ha convertido en una de las infraestructuras necesarias para el desarrollo del metaverso, la inteligencia artificial, los grandes modelos de lenguaje y AIGC. En este intercambio, analizaré la vida pasada y presente de la GPU desde múltiples dimensiones, como la historia, el desarrollo de hardware, el desarrollo de software y el precio de las acciones. Al mismo tiempo, analizaré los rencores entre Nvidia, AMD e Intel y exploraré ideas para romper las restricciones a la exportación de GPU de EE. UU. Y pensar en el primer principio (filosofía) detrás de todo esto y hacer predicciones sobre los precios futuros de las acciones de empresas como Nvidia.



02

En la era AIGC, Alibaba Cloud Video Cloud

Práctica de tecnología de producción de contenido multimedia.




Zou Juan

Experto técnico senior de Alibaba Cloud Intelligence


La tendencia de la videoización y la ola de AIGC chocan, lo que trae muchos cambios al campo de la producción de contenido multimedia: los desafíos de rendimiento de la capa multimedia son cada vez más prominentes y los escenarios de aplicación y los requisitos de experiencia de la producción de contenido multimedia son cada vez más y más diversa.


Este discurso compartirá la arquitectura técnica general de Alibaba Cloud Video Cloud Media Services en la era AIGC, las tecnologías clave para construir un motor de medios integrado que integre la IA y el procesamiento de medios tradicionales, y cómo Alibaba Cloud Video Cloud reconstruye los tres aspectos del contenido multimedia. Los módulos grandes (creación de contenidos, procesamiento de medios y gestión de activos de medios) implementan la tecnología AIGC en escenarios y prácticas de aplicación relevantes.



03

Explorando la implementación de la función de animación Meitu AI




Li Pianzhen

Experto senior en visión por computadora en Meitu


Con el rápido desarrollo de la IA en el campo visual, Meitu espera utilizar la tecnología de IA para ayudar a los usuarios a producir mejor contenido. Desde que se propuso el modelo de difusión, han aparecido en la industria modelos y herramientas que generan imágenes basadas en textos descriptivos simples, como DALLE y Midjourney. Este año poco a poco han ido surgiendo herramientas de producción de contenidos de vídeo como Runway GEN, PIKA, etc. Las aplicaciones AIGC dirigidas a contenido de vídeo enfrentan muchos desafíos en términos de estabilidad e implementación de la generación de video.


Este intercambio se dividirá en tres partes: la primera parte presenta principalmente la aplicación de Meitu en AIGC, la segunda parte presenta una aplicación de video AIGC "AI Animation" lanzada por Meitu a principios del 23 de abril y analiza la animación para los usuarios. desafíos de la creación de contenido.La tercera parte presenta parte de la experiencia de exploración de Meitu en temas como la estabilidad generacional y la experiencia funcional.


04

XMusic: multimodal y controlable

Marco de composición universal de alta calidad.




Tian Sida

Jefe de Tecnología de Medios Inteligentes, Tencent Multimedia Lab 


En los últimos años, AIGC ha logrado grandes avances en los campos del texto y las imágenes: el contenido generado por la IA ha sido comparable al creado por humanos, pero aún no ha alcanzado niveles humanos en términos de generación de música. Por un lado, no pueden controlar de forma flexible la expresión de las emociones y, por otro, no pueden garantizar la calidad de la música producida.


En este intercambio, presentaremos XMusic, que admite contenido modal como imágenes, videos, texto, etiquetas y tarareos como palabras clave para generar música de alta calidad con emociones controlables. XMusic realiza el análisis y el control de condición del contenido multimodal mediante la construcción de XProyector, y realiza la generación y proyección de música entrenando a XComposer, y finalmente realiza un marco de composición general de alta calidad controlable multimodal. Actualmente, XMusic se lanzó en Tencent Cloud y el miniprograma oficial, y todos pueden venir y experimentarlo.




LiveVideoStackCon 2023 Conferencia sobre tecnología de audio y vídeo Estación de Shenzhen

¡Estás cordialmente invitado a participar!


Hora: 24 y 25 de noviembre de 2023

Ubicación: Shenzhen Sentosa Hotel (Sucursal Jade)

Cómo conseguir entradas: escanee el código QR para comprar entradas y ¡ hay descuentos por participación grupal!

Consulta: 13520771810 (mismo número en WeChat), [email protected]


Compra entradas ahora




▼Haga clic a continuación para leer el texto original  ▼

Ingrese al sitio web oficial de LiveVideoStackCon 2023 Shenzhen Station para obtener más información sobre emocionantes discursos


Este artículo se comparte desde la cuenta pública de WeChat: LiveVideoStack (livevideostack).
Si hay alguna infracción, comuníquese con [email protected] para eliminarla.
Este artículo participa en el " Plan de creación de fuentes OSC ". Los que están leyendo pueden unirse y compartir juntos.

Alibaba Cloud sufrió un grave fallo que afectó a todos los productos (ha sido restaurado). El sistema operativo ruso Aurora OS 5.0, una nueva interfaz de usuario, se presentó en Tumblr. Muchas empresas de Internet reclutaron urgentemente programadores de Hongmeng . .NET 8 es oficialmente GA, el último Versión LTS Tiempo UNIX A punto de ingresar a la era de los 1.7 mil millones (ya ingresó), Xiaomi anunció oficialmente que Xiaomi Vela es completamente de código abierto y el kernel subyacente es .NET 8 en NuttX Linux. El tamaño independiente se reduce en un 50%. FFmpeg 6.1 " Se lanza Heaviside". Microsoft lanza una nueva "aplicación para Windows"
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/3521704/blog/10142179
Recomendado
Clasificación