机器学习-白板推导系列笔记（三十二）-VAE

其他 2021-01-23 06:44:05 阅读次数: 0

此文章主要是结合哔站shuhuai008大佬的白板推导视频：变分自编码器_44min

全部笔记的汇总贴：机器学习-白板推导系列笔记

涉及到变分推断和重参数化技巧的内容，建议回顾一下白板推导系列笔记（十二）-变分推断

一、模型表示

VAE实质是一个隐变量模型（Latent Variable Model），我们通过GMM（混合高斯模型）来对比。

GMM	VAE
$k$ 个高斯分布混合	无限个高斯分布的混合
$z\sim Categorical\;Dist$	$z\sim N(0,I)\;\;\;P_\theta(x/z)\sim N(\mu_\theta(z),\Sigma_\theta(z))$

所以VAE的分布为：
$P_\theta(x)=\int_z P_\theta(x,z){d}z=\int_z P_\theta(z)\cdot P_\theta(x|z){d}z$
这个 $P_\theta(x)$ 是intractable的，又因为 $P_\theta(z|x)=\frac{P_\theta(z)\cdot P_\theta(x|z)}{P_\theta(x)}$ ，所以它也是intractable的。

Categorical Dist:

$z$	1	2	$\cdots$	$k$
$p$	$p_1$	$p_2$	$\cdots$	$p_k$

$\sum_{i=1}^K p_i=1\;\;\;\;\;\;\;\;\;\;x|z=i\sim N(x|\mu_i,\Sigma_i)$

二、推断学习

在这里插入图片描述

$P (z) = N (0, I)$
$P_\theta(x|z)= N(\mu_\theta(z),\Sigma_\theta(z))$
$P_\theta(z|x) \;is\;intractable\;\;我们用q_\phi(z|x)来逼近它$

回顾一下EM：

$\log P(x)=ELBO+KL(q_\phi(z|x)||p_\theta(z|x))$
E-Step：当 $q=p_\theta(z|x)$ 时，KL=0，expectation is ELBO
M-Step： $\theta=\argmax ELBO=\argmax E_{p_\theta(z|x)}[\log p_\theta(x,z)]$

所以，

$<\hat \theta,\hat\phi>=\argmin KL(q_\phi(z|x)||p_\theta(z|x))\\=\argmax ELBO\\=\argmax E_{q_\phi(z|x)}[\log p_\theta(x,z)] +H[q_\phi]\\=\argmax E_{q_\phi(z|x)}[\log (p_\theta(x|z)+p_\theta(z))] +H[q_\phi]\\=\argmax E_{q_\phi(z|x)}[\log p_\theta(x|z)] -KL(q_\phi(z|x)||p(z))$

采用SGVI/SGVB/SVI/Amortized Inference，也就是利用神经网络和重参数化技巧来解决这个优化问题。

$\varepsilon \sim N(0,I)\\z|x\sim N(\mu_\phi(x),\Sigma_\phi(x))$
$z=\mu_\phi(x)+\Sigma_\phi^{\frac12}(x)\cdot\varepsilon$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;$ $\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;$

$\;$
$\;$
$\;$
$\;$

下一章传送门：白板推导系列笔记（三十三）-流模型

猜你喜欢

转载自blog.csdn.net/qq_41485273/article/details/112397121

机器学习-白板推导系列笔记（三十二）-VAE

机器学习-白板推导-系列（十二）笔记：变分推断

机器学习-白板推导笔记

机器学习--白板推导系列笔记1 开篇

机器学习-白板推导系列笔记（汇总35/35）

机器学习-白板推导系列笔记（三十五）-DP

机器学习-白板推导系列笔记（三十四）-MDP

机器学习-白板推导系列笔记（三十三）-流模型

机器学习-白板推导系列笔记（三十一）-GAN

机器学习-白板推导系列笔记（三十）-生成模型综述

机器学习-白板推导系列笔记（二十九）-DBM

机器学习-白板推导系列笔记（二十八）-BM

机器学习-白板推导系列笔记（二十七）-DBN

机器学习-白板推导-系列（七）笔记：核函数

机器学习-白板推导-系列（六）笔记：SVM

机器学习-白板推导-系列（十一）笔记：高斯混合模型

机器学习-白板推导-系列（十）笔记：EM算法

机器学习--白板推导系列笔记2 概率：高斯分布之极大似然估计

机器学习-白板推导系列笔记（二十六）-sigmoid信念网络

机器学习-白板推导-系列（二）笔记：高斯分布与概率

机器学习-白板推导-系列（一）笔记：频率派/贝叶斯派

机器学习-白板推导-系列（五）笔记：降维(PCA/SVD/PCoA/PPCA)

机器学习白板推导系列三线性回归

机器学习-白板推导-系列（八）笔记：指数族分布/充分统计量/对数配分函数/最大熵

机器学习-白板推导-系列（三）笔记：线性回归最小二乘法与正则化岭回归

机器学习--白板推导系列笔记4 概率：高斯分布之从概率密度函数角度理解高斯分布

机器学习-白板推导-系列（九）笔记：概率图模型: 贝叶斯网络/马尔可夫随机场/推断/道德图/因子图

机器学习-白板推导-系列（四）笔记：感知机/Fisher判别/判别模型(逻辑回归)/生成模型(高斯判别/朴素贝叶斯)

白板推导笔记

机器学习笔记之十二——SVM原理及推导

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)