此文章主要是结合哔站shuhuai008大佬的白板推导视频：生成对抗网络_54min

一、例子

在这里插入图片描述
其中国宝是一个静态的，不会改变，工艺品和这个节目的鉴定水平是动态的，可学习的。

目标：成为高水平、可以以假乱真的大师。

高水平的鉴赏专家（手段）

高水平的工艺品大师（目标）
（高大师（高专家））

在这里插入图片描述

二、数学描述

我们将上图转化为数学符号

古人： ${x_i\}_{i=1}^N:P_{data}$
工艺品： $P_g(x;\theta_g):generator(P_z(z)+G(z;\theta_g))\;\;\;\;\;\;Z\sim P_Z(z)\;\;\;\;\;\;\;\;\;x=G(Z;\theta_g)$

$x$ 是国宝的概率： $D(x;\theta_d)$

高专家：

如果 $x$ 来自与 $P_{data}$ ，则 $D (x)$ 相对较高。（可以改写为 $\log D(x)$ ）
如果 $x$ 来自与 $P_{g}$ （相当于 $Z$ 来自于 $P_z$ ），则 $D (x)$ 相对较低（可以改写为 $\log (1-D(G(z)))$ ，则这个应该较高）

$\max_D\Bigg[E_{x\sim P_{data}}\Big[\log D(x)\Big]+E_{z\sim P_{z}}\Big[\log (1-D(G(z)))\Big]\Bigg]$

扫描二维码关注公众号，回复： 12192665 查看本文章

高大师：

如果 $x$ 来自与 $P_{g}$ （相当于 $Z$ 来自于 $P_z$ ），则 $D (x)$ 相对较高（可以改写为 $\log (1-D(G(z)))$ ，则这个应该较低）
$\min_GE_{z\sim P_{z}}\Big[\log (1-D(G(z)))\Big]$

总目标：

$\min_G\max_D\Bigg[E_{x\sim P_{data}}\Big[\log D(x)\Big]+E_{z\sim P_{z}}\Big[\log (1-D(G(z)))\Big]\Bigg]$

三、全局最优解

$y ∣ x : d i s c r i m i n a t o r$

$y / x$	1	0
$p$	$D (x)$	$1 - D (x)$

记

$V(D,G)=E_{x\sim P_{data}}\Big[\log D(x)\Big]+E_{x\sim P_{g}}\Big[\log (1-D(x))\Big]$

固定 $G$ ，求 $D^*$ ，记作 $D^*_G$ ：

$max_DV(D,G)$
$\max_DV(D,G)=\int P_{data}\cdot\log D{d}x+\int P_g\cdot\log(1-D){d}x\\=\int\Big[P_{data}\cdot\log D+ P_g\cdot\log(1-D)\Big]{d}x$
关于 $D$ 求偏导：
$\frac{\partial }{\partial D}(\max_DV(D,G))=\frac{\partial }{\partial D}\int\Big[P_{data}\cdot\log D+ P_g\cdot\log(1-D)\Big]{d}x\\=\int\frac{\partial }{\partial D}\Big[P_{data}\cdot\log D+ P_g\cdot\log(1-D)\Big]{d}x\\=\int\Big[P_{data}\cdot\frac1D+ P_g\cdot\frac{-1}{1-D}\Big]{d}x$
令导数为 $0$ ，得到：
$D^*_G=\frac{P_{data}}{P_{data}+P_g}$

将 $D^*_G$ 代入，则有：

$\min_G\max_D V(D,G)=\min_G V(D_G^*,G)\\=\min_GE_{x\sim P_{data}}\Big[\log \frac{P_{data}}{P_{data}+P_g}\Big]+E_{x\sim P_{g}}\Big[\log (1-\frac{P_{data}}{P_{data}+P_g})\Big]\\=\min_GE_{x\sim P_{data}}\Big[\log \frac{P_{data}}{P_{data}+P_g}\Big]+E_{x\sim P_{g}}\Big[\log \frac{P_{g}}{P_{data}+P_g}\Big]\\=\min_GE_{x\sim P_{data}}\Big[\log \frac{P_{data}}{\frac{P_{data}+P_g}2}\cdot\frac12\Big]+E_{x\sim P_{g}}\Big[\log \frac{P_{g}}{\frac{P_{data}+P_g}2}\cdot\frac12\Big]\\=\min_G KL(P_{data}||\frac{P_{data}+P_g}2)+KL(P_g||\frac{P_{data}+P_g}2)-\log 4\\\ge -\log 4$
当 $P_{data}=\frac{P_{data}+P_g}2=P_g$ 时，“=”成立。 $\;$
此时， $P^*_g=P_{data},D^*_g=\frac12$

$\;$
$\;$
$\;$
下一章传送门：白板推导系列笔记（三十二）-变分自编码器

机器学习-白板推导系列笔记（三十一）-GAN

一、例子

二、数学描述

三、全局最优解

猜你喜欢