Stable Diffusion 使用 SadTalker 生成图片数字人

Heygen和D-ID等照片转视频的工具,都需要在线付费使用。本次介绍一个SadTalker数字人。SadTalker有多种使用方式,包括完整安装程序和stable diffusion插件模式。安装程序操作较繁琐,因此推荐stable diffusion插件模式。
在这里插入图片描述

SadTalker安装

打开SD进入扩展复制链接https://github.com/OpenTalker/SadTalker.git到安装路径。
在这里插入图片描述
安装之后重启SD之后点击SadTalker即可。
在这里插入图片描述
下载Checkpoints和gfpgan到extensions\SadTalker文件夹内。
在这里插入图片描述
在这里插入图片描述
配置ffmpeg。打开ffmpeg官网 下载对应系统的文件,以Windows为例,将压缩包下载到本地并解压,打开bin文件夹,复制路径。
在这里插入图片描述

然后右键点击我的电脑-属性-高级系统设置-环境变量-选中Path点击编辑-新建,输入文件夹路径,点击确定。
在这里插入图片描述
在cmd里输入命令ffmpeg出现详细信息即表示ffmpeg安装成功。
在这里插入图片描述

SadTalker使用

左侧上传图片和音频文件。

在这里插入图片描述

  • Pose style 选择人脸姿态,一共47个数字,每个姿态都不一样。
  • face model resolution 根据分辨率选择自己对口型的模型,如果图片较大就选择512。
  • preprocess 这个同图生图中的设置
  • GFPGAN as Face enhancer 是否高清化处理。

猜你喜欢

转载自blog.csdn.net/qq_20288327/article/details/131580341