GAN最新论文解读 - 代码天地

GAN最新论文解读

编程语言 2019-01-10 13:13:17 阅读次数: 0

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

论文地址：

https://arxiv.org/pdf/1811.10597.pdf

GitHub code：https://github.com/CSAILVision/gandissect

首先要介绍的是第一篇，这篇文章的对于GAN的可解释性研究有较大贡献，我把它称为可控GAN。主要看点在于，之前的GAN我们我们可以生成非常逼真的图像，虽然我们可以一定程度上选择生成的多样性，但是我们不能控制生成的对象里面包括哪些，又包括哪些。因为我们不知道GAN里面究竟是如何控制每个类别！

而这篇文章的方法不仅能够控制是否包含某个类别，还能控制生成该类别的数量，如下图所示：

从左到右，控制生成的树的数量由多到少，直到一棵树都没有。这就是这篇文章的突破性的之处，这项研究向理解GAN迈出了非常重要的一步。

这是该文章的demo，大家可以自己体验一下，它不仅可以控制生成什么，不仅可以控制生成多少，还能控制生成的位置（我刚试时有点激动）：

http://gandissect.res.ibm.com/ganpaint.html?project=churchoutdoor&layer=layer4

从视频中可以看到，他可以做到增加某些类别，去除某些类别，也就是GAN已经成为可控的。想想真的有些激动（感觉应用前景很大，比传统的P图快太多，而且更逼真）。

上面介绍这篇文章方法的强大之处，下面介绍它是如何实现的。

具体实现分为两个步骤：解剖（Dissection）和干预（Intervention），为每个类别寻找一套“因果”单元。

首先是第一个阶段：解剖

看着上面的图来讲更直观，整个结构的目的是找出特征图中，具体哪些通道和生成的某个类别的关系，而想要达到控制这个类的生成效果，那么这个关系可以称为因果关系。

更具体地，我们要找出生成图X和特征图r的哪些通道有关。SC（X）是X的语义分割结果只取一个类，即为一个二值图；

取特征图r的某一个通道（文中称为单元），先进行上采样恢复到原始图像尺寸，然后对其进行阈值处理以确定哪个像素被该特定单元“点亮”。阈值通过下面这个公式计算：

得到了右上角的图和右下角的二值图，我们就可以衡量该通道的特征和该类别的空间一致性。判别指标采用IOU：

V代表或运算，另一个是与运算，r（u，p）的箭头指上采样操作。

经过，第一阶段解剖过程，我们知道哪些通道的特征和类别的对应关系，接下来就是如何去干预这个特征，从而通过控制这些特征控制生成。

第二个阶段：干预

猜你喜欢

转载自blog.csdn.net/qq_33547191/article/details/86216704

GAN最新论文解读

20190827最新论文

ECCV22 最新论文汇总（目标检测、图像分割、监督学习、GAN等）

最新论文阅读（１）

重磅更新！YoloV4最新论文！解读yolov4框架

Person ReID最新论文推荐

NLP最新论文paper记录

Litmaps最新论文检索神器

【NeurIPS100】谷歌、Facebook、斯坦福等十篇机器学习最新论文解读

条件GAN论文简单解读

CVPR2019|最新更新论文~持续更新

重磅更新！YoloV4最新论文与源码!翻译!

深度学习分割类最新论文复现

【转载】如何实时接收研究领域最新论文

2023年深圳杯A题最新论文

2023深圳杯 C题最新论文

生成对抗网络GAN论文解读及原理分析

计算机视觉-自然语言处理-语音最新论文阅读网站

李飞飞团队最新论文：如何对图像中的实体精准“配对”？

收下这12篇最新论文，炼丹不愁没灵感 | 本周值得读

何恺明组又出神作！最新论文提出全景分割新方法

还在为周会发愁？你需要这13篇最新论文 | 本周值得读

五大顶会2019必读的Graph Embedding最新论文

目标检测、深度估计、无人驾驶 papers最新论文算法笔记

2020问答系统（QA）最新论文、书籍、数据集、竞赛、课程资源分析

计算机视觉系列最新论文（附简介）

视觉+Transformer最新论文出炉，华为联合北大、悉尼大学发表

最新论文笔记(+18)：TrustFed: A Framework for Fair and Trustworthy Cross-Device Federated Learning in IIoT

最新论文笔记(+13)：Hardening Distributed and Encrypted Keyword Search via Blockchain / PAC2017

最新论文笔记(+12)：Searching an Encrypted Cloud Meets Blockchain: A decentralized, Reliable and Fair Realiz

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)