Improved GAN - 代码天地

Improved GAN

其他 2018-07-20 11:14:42 阅读次数: 0

https://www.bilibili.com/video/av9770302/?p=16

从之前讲的basic gan延伸到unified framework，到WGAN

再到通过WGAN进行Generation和Transformation

复习一下GAN，

首先我们有一个目标，target分布，Pdata，

蓝色部分表示Pdata高，即从这部分取出的x都是符合预期的，比如这里的头像图片

GAN的目的就是训练一个generator nn，让它的输出尽量接近Pdata分布

generator的输入一般都是normal distribution，输出接近Pdata，那么就意味着generator输出的x，高概率会落在蓝色区域，即我们想看到的图片

但这里的问题是，PG是算不出来的，其实这里Pdata我们也是不知道的，我们只有一些训练集，比如一批头像的图片

所以只有用sample的方式来训练

下面给出如何通过sample来训练，

先随机从v1 generator中sample 4张图片作为false，从训练集中取4个作为true，来训练v1 discriminator

然后固定V1 discriminator，来训练出V2 generator

然后固定V1 discriminator，来训练出V2 generator，它产生的x，v1 discriminator都会判true

再训练产生V2 discriminator，让V2 generator生成的x，都被判false

下面的图更形象的表示这一过程，

需要注意的是PG为蓝色曲线，调整generator nn的参数让它close Pdata，这个过程不是渐进的过程，而是一个反复的过程

nn的参数很难调的刚合适，往往或调过了，所以真实的过程是一个反复震荡close的过程

直到两者重合，discriminator就完全无法区分

简单的列出算法，

discriminator训练多次来max V，intuitive的理解V，让D(x)尽量大，即让训练集数据被判true，让D(x~)尽量小，即让generator生成的数据被判false

generator仅仅训练一次来min V，前面一项和generator无关所以不用考虑，min V，就要max D(G(z))，即让generator生成的数据尽量被判true

Unified Framework

下面来学习unifed framework，分成3部分

f-divergence

这篇论文称为f-Gan，Gan中Discriminator和JS-Divergence相关，其实可以任何f-divergence相关

f-divergence就可以用来衡量两个分布的相似度

这个定义对于函数f有两个约束，

其中f(1)=0，当p和q分布相同时，divergence就会取到0

f是convex，可以证明D的最小值就是0，下面通过jensen不等式，很容易证明

举几个f-divergence的例子，

Fenchel Conjugate（共轭）

对于每个convex函数，都存在一个对应的conjugate函数f*

定义是给定一个t，需要调整x，使得后面的式子最大，其中x需要在f的定义域中

这里假设先固定x，这样蓝框中的部分就变成线性函数，对不同的x就是不同的直线，现在对于某个给定t，只是找出最大的那个交点

从图上可以看出，f*也是convex的

右边举个例子，对于xlogx，他的f*就是exponential，从图上也能intuitive的看出

计算过程如下，maximizing就是求微分=0

这里有个重要的特性，就是f** = f，即

代入f-divergence的公式，得到

这个红框中的式子，给定x，找到一个t可以使得它取到最大值，那这个式子可以有个lowbound

如果随便给一个t，那么得到值一定是小于等于这个最大值

假设有个函数D，输入这个x，输出t，就有，因为对于任意一个D，从x算出的t，不一定是可以取到最大值的t

任意D代表下届，那么我们只要调整D，使得让其max，就可以逼近真实值

把上面的式子中，代入Pdata和PG，就得到Pdata和Pg的f-divergence的定义

如果我们要找一个PG，和Pdata尽量相似，也就是要找一个G，使得Df最小，于是得到G*

推导到这里就可以看出，之前GAN的V是怎么来的，这里用不同的f-divergence，即f不同，就可以得到不同的V

之前的GAN只是一种特殊形式罢了

所以这里就得到一种GAN的unified framework，这里列出各种不同的f-divergence

WGAN

WGAN的论文，简单说，就是用earth mover's distance，或者wasserstein distance来衡量分布之间的差异

猜你喜欢

转载自www.cnblogs.com/fxjwind/p/9340280.html

Improved GAN

深度学习-->Improved GAN-->WGAN

李宏毅深度学习-Improved GAN

深度学习-->Improved GAN-->f-GAN

WGAN and WGAN-GP：Wasserstein GAN and Improved Training of Wasserstein GANs

论文阅读——《Wasserstein GAN》《Improved Training of Wasserstein GANs》

GAN

Improved Consistency Regularization for GANs

《Wasserstein GAN》继续 GAN

【GAN】GAN的原理及推导

Monte Carlo methods for improved rendering

An Improved AODV Routing Protocol for VANETs

Improved Techniques for Training GANs(2016)

RePr Improved Training of Convolutional Filters

Improved Baselines with Momentum Contrastive Learning

GAN 合集

GAN总结

条件GAN

GAN分类

Wasserstein GAN

GAN系列

Masking GAN

Gan学习

对GAN的理解

GAN算法

GAN的汇总

关于GAN

GAN相关

Big GAN

GAN汇总

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)