EDGAN论文阅读笔记

题目:Enhanced Discriminative GenerativeAdversarial Network for FaceSuper-Resolution

中文:用于FaceSuper分辨率的增强型判别式生成专家网络

在这里插入图片描述

  • 最近,一些基于生成对抗网络(GAN)的超分辨率(SR)方法已经发展到可以通过使用生成器(G)和鉴别器(D)对抗方案生成照片般逼真的自然图像的程度。但是,基于普通 GAN的SR方法无法同时在现实世界的面部图像上实现良好的重建和感知保真度。由于存在D loss,它们很难稳定收敛,这可能会导致模型崩溃。在本文中,我们提出了一种用于SR人脸识别的增强型区分生成对抗网络(EDGAN),以实现更好的重建和感知保真度。首先,我们发现多功能D促使可以使对抗框架达到最佳的Nash平衡。然后,我们通过密集连接设计D,从而带来更稳定的对抗损失。此外,通过重用D的中间特征,一种新颖的感知损失函数被用于消除Gs的梯度消失问题。据我们所知,这是专注于提高D的性能的第一个框架。定量的实验结果表明,EDGAN在两个广泛使用的面部图像数据库上的优势优于具有不同术语的最新方法。与竞争对手相比,EDGAN在具有较大姿势和照明变化的真实人脸图像上执行更清晰,逼真的结果。

背景:普通GAN网络,存在D loss,它们很难稳定收敛,这可能会导致模型崩溃
方法:提出一种用于SR人脸识别的增强型区分生成对抗网络(EDGAN),
结论:与竞争对手相比,EDGAN在具有较大姿势和照明变化的真实人脸图像上执行更清晰,逼真的结果。

在这里插入图片描述

图1.Wild(LFW)数据集中带有标签的人脸的视觉结果[6],缩放比例为4。(a)SRGAN经过20,000次迭代训练。 (b)SRGAN接受了200,000次迭代的培训。 (c)Ours。 (d)基本事实。从(a)和(b)中可以看出,随着迭代次数的增加,SRGAN的性能会变差
在这里插入图片描述
2 SRGAN和我们方法的收敛性分析,所有模型都使用LFW数据集进行训练。根据Goodfellowetal。[4],如果G和D具有足够的能力,则每个理论上都可以达到两者均无法提高的程度,因为当HR = SR时,D无法区分HR和SR
在这里插入图片描述
3,我们提出的EDGAN的体系结构,指出了每个卷积层的内核尺寸(k),特征图数量(n)和步幅(s)。术语Φi表示卷积层计算的特征图(激活后)功能层介绍)
在这里插入图片描述
4、RDB(左)和DDB(右)的体系结构。在RDB中,卷积层的数量(紧随其后的是ParametricReLU)为6,在DDB中,卷积层的数量(其后为批量归一化层和LeakyReLU)为2i-1 + 1。
在这里插入图片描述
5.视觉重建结果[4×放大]和LFW数据集中的HR图像的相应参考,所有方法都用LFW数据集训练。我们突出显示了富含面部细节的子区域。我们将右侧框中的子区域放大以显示更多细节。从子区域图像可以看出,我们的方法具有更强的能力来恢复高频细节和锐利边缘。
在这里插入图片描述
6.SRGAN-MSE和SRGAN-VGG54是Ledigetal提出的模型。[3] .SRResnet + EDN是用EDN代替原始鉴别器的SRGAN。

结论

  • 在本文中,我们强调了基于GAN的超分辨率方法在超分辨率人脸识别问题中的一些局限性。最大限制是鉴别器的不稳定。为了解决这个问题,我们引入了EDGAN,它通过使用密集连接的卷积网络来增强判别过程。我们设计了单个损失函数,并将它们组合起来分别形成鉴别器和生成器的目标函数。我们的方法在不同指标上超越了其他最新技术,并且在现实世界中的低分辨率人脸图像上以较高的感知保真度也显示出良好的结果。

猜你喜欢

转载自blog.csdn.net/mzj15101229871/article/details/113276320