文献阅读:SRFeat: Single Image Super-Resolution with Feature Discrimination

文章地址: http://openaccess.thecvf.com/content_ECCV_2018/html/Seong-Jin_Park_SRFeat_Single_Image_ECCV_2018_paper.html
作者的项目地址:SRFeat-Tensorlayer

1 简单介绍

    虽然已有的基于GAN的超分辨率方法能够被用来生成真实的纹理信息,但是它们都倾向于生成与输入图像无关的不太有意义的高频噪声。于是,作者增加了一个作用于特征域的判别网络,使得生成网络能够生成与图像结构相关的高频特征。
    作者的创新:

  1. 在SR框架下提出了二种判别器,分别是图像域,还有特征域,产生高频的信息而不是噪声。
  2. 生成器中使用了长范围的跳跃连接,让相距较远的层信息更容易流动。

2 网络

     生成器的网络和之前的SRResNet很类似,只是多了长范围的跳跃连接,作者认为之前的SRResNet对待每一个layer特征是一样的,我们通过1×1的conv将不同levle的特征连接起来,然后可以动态调整它的权重,然后在最后一层相加起来,其实这其中蕴含着注意力机制的思想。作者解释这样做的好处有:

  1. 后向传播过程梯度更容易更新
  2. 充分利用中间层的特征来提高最后的特征。

生成网络的结构如下:
在这里插入图片描述
之后由亚像素卷积层完成尺寸放大的操作。判别网络结构是普通的网络,和SRResNet是一样的。判别网络如下:
在这里插入图片描述
     在训练网络时,作者总共有两步。第一步就是先用均方误差预训练生成网络,这个是用ImageNet进行训练的。然而,此时得到的结果并不能得到视觉上让人满意的结果。第二步再用感知损失和两个对抗损失来训练网络。其中感知损失的方法就是让HR和重建图像通过一个VGG19的网络,然后计算MSE。其中一个对抗损失对应的是图像判别网络,也就是和原有方法一样,对图像的像素值进行评判。另外一个对抗损失则对应的是特征判别网络,是对图像的特征图进行评判,即将感知损失中计算的对象交由判别网路进行判断。感知损失目的是让HR和SR图像在感觉上具有一致性,而特征GAN损失是能够产生感受上高频信息而不是高频噪声,通过添加这个特征判别网络,生成网络被训练得能够合成更多有意义的高频细节。作者提到,他们尝试了多种特征判别网络的结构,但是得到的结果都很接近。

3 实验

     作者实现证明了长范围的跳跃连接的有效性。 w/o Conv是没有1*1的conv操作, w/o Skip是没有长范围的跳跃连接。
在这里插入图片描述
     作者然后验证了特征域的gan损失有效性。重建是将sr和hr图像送到分类网络,计算top1和top5错误率。其中SRFeatI是不含特征域的gan损失,而SRFeatIF是包含特征域的gan损失。
在这里插入图片描述
     最后是从视觉角度上来看。
在这里插入图片描述

4 感想

     最近在利用GAN进行SR过程中,虽然加入感受损失可以很好的产生视觉上令人满意的效果,但是这往往也会产生高配的噪声,而这HR是没有的。在这篇文章中最大的创新就是引入了特征域的gan损失,让网络更好的产生高频的细节而不是噪声。其他方面就是在生成器引入了DenseNet和注意力机制的思想。在作者的展望中提到了这里的引入vgg-19中某一固定成,比如conv-5,在以后工作看能不能自适应的学习到最佳层。

猜你喜欢

转载自blog.csdn.net/alxe_made/article/details/85839871