解读DreamPose:基于Diffusion Models的模特视频生成

Diffusion Models视频生成-博客汇总

前言:谷歌研究院联合英伟达提出了DreamPose,通过修改起点噪声融入姿态信息,并微调VAE-CLIP adapter注入图片信息,做到pose&image-to-video的效果。是少数扩散模型中image-to-video的工作,这篇博客详细解读一下这篇论文《DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion》。

目录

贡献概述

方法详解

整体结构

猜你喜欢

转载自blog.csdn.net/qq_41895747/article/details/134137888