CVPR2022 | 曾经火爆全网的算法！升级版来袭，支持卡通形象！ - 代码天地

CVPR2022 | 曾经火爆全网的算法！升级版来袭，支持卡通形象！

企业开发 2023-04-07 05:02:32 阅读次数: 0

大家好，我是阿潘

之前 ”蚂蚁呀嘿“ 的算法火的不行。今年的CVPR 2022 ，又有一个新算法，效果更加炸裂！相比之前，现在对于动漫头像的驱动效果也可以做到非常的逼真！

按照惯例，先看效果视频：

论文：Depth-Aware Generative Adversarial Network for Talking Head Video Generation

资料汇总：

https://arxiv.org/pdf/2203.06605.pdf https://github.com/harlanhong/CVPR2022-DaGAN https://harlanhong.github.io/publications/dagan.html

摘要

talking head 视频生成旨在生成合成人脸视频，其中包含分别来自给定源图像和驱动视频的身份和姿势信息。这项任务的现有工作严重依赖从输入图像中学习的 2D 表示（例如外观和运动）。然而，密集的 3D 面部几何（例如像素深度）对于这项任务非常重要，因为它对我们从本质上生成准确的 3D 面部结构并将噪声信息与可能杂乱的背景区分开来特别有益。然而，密集的 3D 几何标注对于视频来说成本高得令人望而却步，并且通常不适用于此视频生成任务。在本文中，我们首先介绍了一种自监督几何学习方法，可以自动从人脸视频中恢复密集的 3D 几何（即深度），而不需要任何昂贵的 3D 标注数据。基于学习到的密集深度图，我们进一步建议利用它们来估计捕捉人头关键运动的稀疏面部关键点。以更密集的方式，深度还用于学习 3D 感知的跨模态（即外观和深度）注意力，以指导生成运动场以扭曲源图像表示。所有这些贡献构成了一个新颖的深度感知生成对抗网络（DaGAN），用于talking head 生成。进行的大量实验表明，我们提出的方法可以生成高度逼真的人脸，并在看不见的人脸上取得显着效果

Talking Head Generation 是什么

Talking Head Generation 的目的是合成一个人脸视频，这个合成视频的身份和姿态信息分别来源一个给定的source图片和驱动视频

相关方法

Xface

FOMM（目前最流行的方法，之前爆火）

Face-vid2vid 等等

主要挑战

1、现有的工作严重依赖于 2D 表征

2、现有方法确实人脸细节

3、3D 几何标注不可用

然而密集的 3D 面部几何结构对于这项人物非常重要，因为它对我们生成准确的3D面部结果特别又帮助。密集的 3D 几何标注对于视频来说成本很高，并且通常不适用于此视频生成任务。

主要贡献：

1、引入自监督学习方法来从面部视频中恢复显式密集 3D 几何以生成说话头视频的方法

2、提出了一个与深度图合作的框架来解决说话头的生成问题

3、与现有方法相比，我们的方法可以产生更好的结果

模型框架

我们首先引入了一种自监督的几何学习方法，可以自动从人脸视频中恢复密集的 3D 几何，而不需要任何昂贵的 3D 标注数据。

基于学习到的密集深度图，进一步使用深度图来估计稀疏的面部关键点，以捕捉人体头部的关键运动。以更密集的方式，深度还用于学习 3D 感知的跨模态注意力以改进生成结果。

在自监督人脸深度学习模块中，我们使用估计的深度图、源视图和相机矩阵通过公式 3 重构目标视图。

因此，我们可以通过重构损失学习一个满意的人脸深度网络。

从人脸深度网络获得深度图后，我们采用特征扭曲策略来捕捉源图像和目标图像之间的头部运动。

重要的是，在这个模块中预测了一个运动流掩码和一个遮挡图。运动流掩码为估计的密集 2D 运动场分配不同的置信度值，而遮挡图旨在掩盖由于头部旋转变化而应修复的特征图区域，有效嵌入学习的深度图，以更密集的方式促进生成。。

我们提出了一种跨模态注意机制，使模型能够更好地保留面部结构并生成与表情相关的微面部运动，因为深度可以为我们提供密集的 3D 几何，这对于保持面部结构和识别关键动作我们首先展示了从所提出的面部深度网络中恢复的人脸深度图。

我们将学习到的人脸深度图及其对应的 3d 点云可视化。学习到的密集 3D 面部结构显然非常有益，并有显着改善。

此外，我们将密集的深度感知注意力图可视化。

每个查询点的高激活区域主要位于人脸表情相关的部分。

这些可视化结果表明，我们设计的跨模态注意力模块，确实可以解决人脸的微运动，从而在生成过程中产生更生动的表情

另外代码部分作者已开源，感兴趣的可以去尝试哈：

今天的分享就到这里，大家喜欢的话，可以多多支持，感谢！

推荐阅读

Arxiv论文这样子下载！是真的快！

用 AI 做了一个体感游戏！真人拳皇搞起！

杀疯了！本科大神毕设：3D虚拟主播软件！独创AR直播！支持OBS！开源！

猜你喜欢

转载自blog.csdn.net/flyfor2013/article/details/125568106

CVPR2022 | 曾经火爆全网的算法！升级版来袭，支持卡通形象！

CVPR2022 | ZeroCap：零样本图像到文本生成的视觉语义算法

【CVPR2022】VizWiz-VQA Grounding Challenge冠军算法介绍--Aurora

CVPR2022

CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识

【YOLOv7/YOLOv5系列算法改进NO.37】结合CVPR2022新作ConvNeXt网络

CVPR2022 前沿研究成果解读：基于生成对抗网络的深度感知人脸重演算法

CVPR2022 | 可精简域适应

CVPR2022 | CVPR2022最全整理，CVPR2022下载链接，CVPR2022全部论文代码

CVPR2022《A ConvNet for the 2020s》

【CVPR2022】QueryDet论文精读

CVPR2022目标检测方向论文

Curve Modeling：车道线检测新工作（CVPR2022）

CVPR2022 Oral：GAN监督的密集视觉对齐

CVPR2022 | 长期行动预期的Future Transformer

CVPR2022 | 简单高效的语义分割体系结构

wFlow(CVPR2022)-虚拟试衣论文解读

CVPR2022《Mobile-Former: Bridging MobileNet and Transformer》

PHORHUM(CVPR2022)-3D重建论文解读

CVPR2022《An Image Patch is a Wave: Quantum Inspired Vision MLP》

CVPR2022《Cascade Transformers for End-to-End Person Search》

Latent Diffusion（CVPR2022 oral）-论文阅读

HumanNeRF（CVPR2022 oral）-人体重建论文阅读

TPS Motion（CVPR2022）视频生成论文解读

CVPR2022论文列表（中英对照）

CVPR2022《TransMix: Attend to Mix for Vision Transformers》

preprint版本 | 何凯明大神新作MAE | CVPR2022最佳论文候选

【CVPR2022】无需示例的类增量学习的自我维持表示扩展

CVPR2022：通过基于神经元属性的攻击提高对抗迁移性

CVPR2022 | 重新审视池化：你的感受野不是最理想的

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)