GAN 原理 - 代码天地

GAN 原理

其他 2020-03-29 21:02:32 阅读次数: 0

文章目录

各种散度

熵
交叉熵
KL散度
JS 散度

GAN 原理

训练产生问题

WGAN

Earth-Mover（EM）距离
WGAN

Relativistic GANs

各种散度

熵

在这里插入图片描述
在P分布携带的信息量
/
对P分布的样本使用基于P的编码所需的最小字节数

交叉熵

在这里插入图片描述
从Q分布的角度来看P分布的信息量
/
对P分布的样本使用基于Q的编码所需的所需要的“平均的编码长度”
为何交叉熵可以用来衡量损失？参考
训练样本P分布的熵是恒定的，最小化交叉熵等于最小化KL散度，即用当前分布来拟合训练数据分布的信息量损失。

KL散度

在这里插入图片描述

不对称性非负性

使用Q分布来近似P分布时信息的损失量
/
对P分布的样本使用基于Q的编码“额外所需的编码长度”。

JS 散度

在这里插入图片描述
对称性 0-1之间越小越相似

GAN 原理

根据原始GAN定义的判别器loss，我们可以得到最优判别器的形式；而在最优判别器下,可以把原始GAN定义的生成器loss等价变换为最小化真实分布 $P_r$ 与生成分布 $P_g$ 之间的JS散度。
在这里插入图片描述

固定G，求出最优的D，然后代入max DV（G，D）,得到的是JS散度，最小为-2log2
最小化上式，即最优化JS散度，那么必然

训练产生问题

G、D训练互相影响
更新G之后，确实对应的JS散度变小了，但是同时影响了V（G,D）曲线，那下次的maxV(G,D)可能变大了，就是说D拟合两者分布的能力变差了
解决方式更新多次D，更新一次G
JS 散度问题解决方式加噪声
图片是由低维的vector到高维生成的，由于 $P_r$ 与 $P_g$ 几乎不可能有不可忽略的重叠，所以无论它们相距多远JS散度都是常数 $\log 2$ ，最终导致生成器的梯度（近似）为0，梯度消失。
改进的生成器loss 导致不稳定&collapse mode 多样性不足

等于最小化
又要最小化KL,又要最大化JS 梯度不稳定

前面KL的毛病：不对称
在这里插入图片描述
第一项是没有生成真实数据集里存在的样本，第二项是错误生成了真实数据里没有的样本，那我宁愿不去生成多样性的样本，不试错。

WGAN

Earth-Mover（EM）距离

而W(P_r, P_g)就是“最优路径规划”下的“最小消耗”
在所有可能的联合分布下，求真实样本和生成样本距离的期望，取这个期望的下界。
也就是在最优的联合分布下，将Pr挪到Pg的最小消耗。
Wasserstein距离相比KL散度、JS散度的优越性在于，即便两个分布没有重叠，Wasserstein距离仍然能够反映它们的远近。

WGAN

在这里插入图片描述
对真实样本来说取f(x)，对生成样本来说取-f(x)的上界，对参数w梯度有限制。

拉普拉斯连续

与原始GAN 区别：
1.损失函数
在这里插入图片描述

参数截断以满足拉普拉斯条件
去掉判别器中的sigmoid
因为原始D(x)拟合的是0、1值，而在这里判别器拟合的是Wassertain 距离。

Relativistic GANs

在这里插入图片描述

发布了35 篇原创文章 · 获赞 2 · 访问量 1417

私信关注

猜你喜欢

转载自blog.csdn.net/qq_30776035/article/details/104694112

【GAN】GAN的原理及推导

GAN原理

GAN 原理

GAN的原理入门

GAN公式原理推到

GAN 原理及公式推导

GAN的数学原理

39、GAN原理

gan算法原理

GAN简介及原理分析

GAN的原理（李宏毅GAN笔记）

各种GAN原理总结及对比

GAN原理学习笔记

GAN原理及Pytorch框架实现GAN（比较容易理解）

深入浅出GAN框架原理

GAN原理，优缺点、应用总结

GAN-生成对抗网络原理

Cycle-GAN 模型介绍----原理简介

理解GAN网络基本原理

GAN网络原理介绍和代码

GAN,cGAN 对抗网络概念，原理简述

【GAN】基础原理讲解及代码实践

GAN原理及简单mnist生成图片

GAN

【GAN与NLP】GAN的原理 —— 与VAE对比及JS散度出发

GAN对抗生成网络学习笔记（二）GAN网络原理

生成对抗网络（GAN）原理+tensorflow代码实现

深度学习----现今主流GAN原理总结及对比

深度学习总结：GAN，原理，算法描述，pytoch实现

对于GAN（生成对抗网络）原理的通俗理解

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)