【计算机视觉】利用GAN Prior来处理各种视觉任务

近一两年计算机视觉的一大热点就是利用GAN Prior来处理各种视觉任务(主要是low-level的任务),具体是利用在大规模数据集上训练好的GAN,借助其学习到的数据分布,并协同task-specific的约束,完成特定任务,整体的思路比较有意思。

  • Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation, ECCV 2020 oral
    这个工作旨在挖掘预训练GAN中的图像先验的方式,无需针对特定任务的设计,实现多种图像复原(上色,补全,超分辨率,对抗防御)和图像编辑(随机扰动,图像变形,类别转换)效果。大致思路如下图所示,通过搜索隐变量z的空间,并对生成器参数空间θ进行微调,从而使采样得到的图像经过退化能够使输入的退化图像尽可能一致。对于loss,本文使用的是判别loss,并且在训练过程中,采用渐进训练的方式,先调整G的浅层权重,然后再调整深层权重。最终得到的效果相当不错,值得借鉴。
    在这里插入图片描述
  • Image Processing Using Multi-Code GAN Prior, CVPR 2020
    本工作利用训练好的GAN模型来进行图像处理,包括image colorization, super-resolution, image inpainting, and semantic manipulation等多个任务。具体的是,利用多个latent code从而得到多个生成器的中间特征,并通过设置adaptive channel importance来对图像进行重构。
    在这里插入图片描述
  • Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation, arXiv2020
    本文是利用训练好的StyleGAN来进行Image-to-Image的变换,为此提出了Pixel2Style2Pixel (pSp)的模型,如下图所示。该方法与上面的方法不同点在于,pSp首先采用了一个网络进行style的提取,然后将style嵌入到styleGAN中,完成图像的变换。
    在这里插入图片描述

参考
知乎博文:ECCV2020 Oral | Deep Generative Prior:实现通用的图像复原与编辑

猜你喜欢

转载自blog.csdn.net/yideqianfenzhiyi/article/details/110455653