Image De-raining Using a Conditional Generative Adversarial Network

经典的有关本方向的GAN网络文章
引入CGAN去执行一个附加的约束,derain图像必须更加接近ground-truth
提出了GAN的对抗LOSS和新型的LOSS函数
生成器子网络利用密集连接网络(dense network)
鉴别器是利用全局和局部信息来判断图像的真伪。
contribution

  1. 不需要post-processing的一个传统的条件GAN;
  2. 专门为单幅图像去雨设计的密集连接生成器;
  3. 多尺度鉴别器; leverage both local and global information;
    We aim to directly learn a mapping from an input rainy image to
    a de-rained (background) image by constructing a conditional
    GAN-based deep network called ID-CGAN.

在这里插入图片描述
生成器应该在不丢失背景细节的情况下尽可能的删除rain streak
由于现有的方法都是对称的结构(adopted a symmetric (encoding-decoding) structure)所以该作者也在生成器中使用对称结构。用密集块去代替现存GAN生成器中使用的U-net和残差块。密集块能够产生strong梯度流和result in improved parameter efficiency。
第j个稠dense block Dj:
在这里插入图片描述
每一个密集块后跟着一个过渡块T: Tu上采样;Td下采样;
Tn不进行采样;
生成器网络如下
在这里插入图片描述
其中CBLP 为 卷积层-batch normalization-leak Relu-池化层
在这里插入图片描述
在这里插入图片描述
PatchGAN由朱俊彦的一文中提出使用[https://openaccess.thecvf.com/content_cvpr_2017/papers/Isola_Image-To-Image_Translation_With_CVPR_2017_paper.pdf]
也是比较经典的Pix2PixGAN
之前的GAN鉴别器,是输入图片,输出一个神经元,判别图片是真还是假,我们可以称为Image GAN

如果鉴别器输入图片,输出的是w×H×1,针对每个像素的真假进行了预测,我们称为Pixel GAN

patchGAN是在两者之间,输出一个30×30×1,每个神经元对应的感受野大小是70×70,我们称为Patch GAN(70x70)。文章中默认经过三次卷积网络得到输出。文章中说测试了70在他的实验中表现的好,性能超过Image GAN和Pixel GAN
注意,文章中鉴别器默认使用了三次卷积网络,同时他是一个域转换的条件GAN,需要同时feed进去input和output的图片,也就是concate到一起输入D.
在这里插入图片描述
作者解释了为什么用于图像去雨这种像素级别任务的GAN
是不稳定而且通过条件引导的生成器容易产生噪声和incomprehensible 的结果。
这是由于新的输入may 不服从训练样本的distribution
如何解决? 网络中引入新的感知损失 perceptual loss
在这里插入图片描述
LA代表对抗损失;LP代表感知损失;LE代表每像素的损失(欧几里得损失)λa λp如果都为0,则网络变成一个简单的CNN,主要目的就是最小化groundturth与derain result的欧几里得损失;如果λp为0 则网络变为一个简单的GAN;如果λa为0,则变成论文 “Perceptual losses for real-time style transfer and super-resolution”中的损失函数
λa = 6.6 × 10^-3
and λp = 1

猜你喜欢

转载自blog.csdn.net/HenryFanQAQ/article/details/111171954