解读VideoComposer:多模态融合视频生成

Diffusion Models视频生成-博客汇总

前言:达摩院出品的VideoComposer,是Composer家族的重要成员,开辟了组合多种模态特征生成视频的先河。重要的是开源了推理代码和模型,利于后人研究。这篇博客详细解读一下VideoComposer论文原理。

目录

贡献概述

方法详解

多模态特征融合

猜你喜欢

转载自blog.csdn.net/qq_41895747/article/details/131371620