机器学习-白板推导系列笔记（二十七）-DBN

其他 2021-01-23 06:45:20 阅读次数: 0

此文章主要是结合哔站shuhuai008大佬的白板推导视频：深度信念网络_72min

全部笔记的汇总贴：机器学习-白板推导系列笔记

对应花书20.3

一、介绍

DBN（深度信念网络）的引入开始了当前深度学习的复兴。实质上是一个混合模型
在这里插入图片描述

$P(v,h^{(1)},h^{(2)},h^{(3)})=P(v|h^{(1)},h^{(2)},h^{(3)})\cdot P(h^{(1)},h^{(2)},h^{(3)})\\=P(v|h^{(1)})\cdot P(h^{(1)},h^{(2)},h^{(3)})\\=P(v|h^{(1)})\cdot P(h^{(1)}|h^{(2)})\cdot P(h^{(2)},h^{(3)})\\=\prod_iP(v_i|h^{(1)})\cdot\prod_jP(h_j^{(1)}|h^{(2)})\cdot P(h^{(2)},h^{(3)})$

$\theta=\{w^{(1)},w^{(2)},w^{(3)},b^{(0)},b^{(1)},b^{(2)},b^{(3)}\}\\w_{:,i}:i \;th\;column\;nector\;of\;w$

$P(v_i|h^{(1)})=sigmoid({w_{:,i}^{(1)}}^T\cdot h^{(1)}+b_i^{(0)})$
$\;$
$P(h_j^{(1)}|h^{(2)})=sigmoid({w_{:,i}^{(2)}}^T\cdot h^{(2)}+b_j^{(1)})$
$\;$
$P(h^{(2)},h^{(3)})=\frac1Z\exp\{ {h^{(3)}}^T\cdot w^{(3)}\cdot h^{(2)}+{h^{(2)}}^T\cdot b^{(2)}+{h^{(3)}}^T\cdot b^{(3)}\}$

二、Stacking RBM

在这里插入图片描述

$P(v)=\sum_{h^{(1)}}P(v,h^{(1)})\\=\sum_{h^{(1)}}\underset{prior}{\underbrace{P(h^{(1)})}}\underset{fixed}{\underbrace{P(v|h^{(1)})}}$
$P(h^{(1)})=\sum_{h^{(2)}}P(h^{(1)},h^{(2)})$

我们通过ELBO来看这两个模型，我们先看上图中下面的模型，

$\log p(v)=\log\sum_{h^{(1)}}p(v,h^{(1)})\\=\log\sum_{h^{(1)}}q(h^{(1)}|v)\frac{p(v,h^{(1)})}{q(h^{(1)}|v)}\\=\log E_{q(h^{(1)}|v)}\Big[\frac{p(v,h^{(1)})}{q(h^{(1)}|v)}\Big]\\\geq E_{q(h^{(1)}|v)}\Big[\log\frac{p(v,h^{(1)})}{q(h^{(1)}|v)}\Big]\\=\sum_{h^{(1)}}q(h^{(1)}|v)\Big[\log p(v,h^{(1)})-\log q(h^{(1)}|v)\Big]\\=\sum_{h^{(1)}}q(h^{(1)}|v)\Big[{\color{blue}\log p(h^{(1)})}+\log p(v|h^{(1)})-\log q(h^{(1)}|v)\Big]$

2nd layer RBM Learning等价于maximum log-likelihood over $p(h^{(1)})$

我们增加一层就是为了让 $p(h^{(1)})$ 的似然达到最大，也就是improve了上式中的蓝色部分，也就提高了ELBO。

三、贪心预训练

$\log p(v)\geq ELBO=\sum_{h^{(1)}}q(h^{(1)}|v)\cdot\log p(v,h^{(1)})-\sum_{h^{(1)}}q(h^{(1)}|v)\log q(h^{(1)}|v)$

$q(h^{(1)}|v)=\prod_i q(h_i^{(1)}|v)=\prod_isigmoid(w_{i,:}^{(1)}\cdot v+b_i^{(1)})$

在这里插入图片描述
DBN $\longrightarrow$ ELBO is relatively loose.

下一章传送门：白板推导系列笔记（二十八）-玻尔兹曼机

猜你喜欢

转载自blog.csdn.net/qq_41485273/article/details/112311391

机器学习-白板推导系列笔记（二十七）-DBN

机器学习-白板推导系列笔记（二十九）-DBM

机器学习-白板推导系列笔记（二十八）-BM

机器学习-白板推导系列笔记（二十六）-sigmoid信念网络

深度学习（二十七）——RBM & DBN & Deep Autoencoder

机器学习-白板推导笔记

机器学习--白板推导系列笔记1 开篇

机器学习-白板推导系列笔记（三十五）-DP

机器学习-白板推导系列笔记（三十四）-MDP

机器学习-白板推导系列笔记（三十三）-流模型

机器学习-白板推导系列笔记（汇总35/35）

机器学习-白板推导系列笔记（三十二）-VAE

机器学习-白板推导系列笔记（三十一）-GAN

机器学习-白板推导系列笔记（三十）-生成模型综述

机器学习-白板推导-系列（十二）笔记：变分推断

机器学习-白板推导-系列（十一）笔记：高斯混合模型

机器学习-白板推导-系列（十）笔记：EM算法

机器学习-白板推导-系列（七）笔记：核函数

机器学习-白板推导-系列（六）笔记：SVM

机器学习（二十七）— EM算法

机器学习--白板推导系列笔记2 概率：高斯分布之极大似然估计

机器学习-白板推导-系列（五）笔记：降维(PCA/SVD/PCoA/PPCA)

机器学习-白板推导-系列（二）笔记：高斯分布与概率

机器学习-白板推导-系列（一）笔记：频率派/贝叶斯派

机器学习白板推导系列三线性回归

机器学习（二十七）——Q-learning, 动态规划

javascript基础学习系列二十七：for-in语句

机器学习-白板推导-系列（八）笔记：指数族分布/充分统计量/对数配分函数/最大熵

机器学习-白板推导-系列（三）笔记：线性回归最小二乘法与正则化岭回归

python学习笔记（二十七）多线程与多进程

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)