【专题速递】多模态数字人、多模态媒体大模型以及AI与AIGC对音视频的影响

  //  

随着AIGC内容的兴起,多模态媒体大模型逐渐进入大家的视野,而LLM的发展又让人们对未来音视频工具产生了新的思考。7月29日LiveVideoStackCon2023上海站AIGC与内容生产专场,集齐当下最热门的AIGC话题,与您共享。


AIGC与内容生产 

在技术、需求与产业链的共同驱动下,人们也从继UGC、PGC后,迈向了AIGC这个新兴的内容生产时代。但AIGC并不是一门单一的技术,它的本质是利用AI赋能技术而形成的一种高自由度且低门槛的内容生产能力,而这种能力将服务于各类场景中的创作者与生产者。

TOPIC1《华为云MetaStudio多模态数字人进展及挑战介绍》

李明磊 华为 虚拟数字人技术负责人

数字人作为AI能力集大成者,涉及计算机视觉、计算机图形学、语音处理、自然语言处理等技术,正在金融、政务、传媒、电商等领域应用越来越广。本报告主要介绍华为云在数字人领域当前的主要进展,包括2D数字人驱动、3D数字人建模、绑定、驱动、情感数字人生成等,同时介绍数字人领域的一些挑战。


本次分享将分为三个部分,第一个部分介绍华为云云原生数字人生产管线介绍及业务规划;第二部分介绍华为云2D数字人技术进展介绍,如何解决口型驱动、肢体编排、移动场景驱动等问题;第三部分介绍华为云3D数字人建模、绑定、驱动等技术的进展。

TOPIC2《AIGC音视频工具分析和未来创新机会思考》

王闻宇-PPIO CTO&联合创始人

大语言模型LLM和其他AIGC的技术发展,会给音视频行业带来哪些变化呢?我将会盘点一些很不错的硅谷流行的AIGC应用,然后进行技术+商业的一些思考,分析音视频结合AIGC在未来的创新创业机会所在。

演讲大纲:

1. AIGC给全行业带来了十倍变化要求;2. 盘点几款不过的硅谷AIGC应用;
3. 思考AIGC的本质和音视频的连接;4. 音视频行业未来的创新创业机会在哪

 TOPIC3《AI重新定义音视频生产力“新范式”》

武磊-网心科技 副总裁

主要框架:1、面向新摩尔定律时代,AI技术对音视频内容的影响;2、AI对音视频生产力的革新,需求构建怎样的基础设施与算力平台?3、AI智能化应用与构建实践。

 TOPIC4《从AIGC到多模态媒体大模型》

宋利-上海交通大学 教授

本次演讲将从多模态媒体生成、多模态媒体编码和多模态媒体交互三个方面展现新一代多模态媒体的特点以及未来基于大模型的智能跨模态编码的新趋势。


d8af061d5d81ac90f276f7415a78373e.png扫描图中二维码或点击“阅读原文 

查看更多LiveVideoStackCon 2023上海站精彩话题

猜你喜欢

转载自blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/131820418