【ML-17-1】MCMC--蒙特卡罗方法（Monte Carlo）

其他 2020-04-19 00:01:16 阅读次数: 0

目录

蒙特卡洛方法概述
采样方法
小结

从名字我们可以看出，MCMC由两个MC组成，即蒙特卡罗方法（Monte Carlo Simulation，简称MC）和马尔科夫链（Markov Chain ，也简称MC）。这个因为受限玻尔兹曼机（RBM）中需要应用，所以先学习下其原理。本文先讲解蒙特卡洛方法。

一、蒙特卡洛方法概述

蒙特卡罗（Monte Carlo）原来是一个赌场的名称，用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法，这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题，比如圆的面积求解。再比如积分：

如果此时f(x)很难求出其原函数时，那么这个积分就非常难求。当然我们可以通过蒙特卡洛方法来模拟求解近似值，假设我们的函数f(x)如下图所示

从高中学习知识可知：假设x的采样数据在[a，b]之间是均匀分布的前提下的，可以通过微分和积分思想来进行求解，如下式所示（当n无穷大时，所求的值就是积分值）：

以上的假设是均匀分布，而绝大部分情况，在[a,b]之间不是均匀分布的。如果我们用上面的方法，则模拟求出的结果很可能和真实值相差甚远。怎么解决这个问题呢？

一般我们采用假设方式：假设 x 在[a,b]的概率分布函数 p(x)，那么我们的定积分求和可以这样进行：

（注意最后是约等于，近似看成为前者的期望值）

假设概率分布为均匀分布，很容易转换成高中学习过的那个积分：

可以看出，两种积分形式就是一般和特例的关系。

二、采样方法

蒙特卡罗方法的关键是得到的概率分布。如果求出了的概率分布，我们可以基于概率分布去采样基

于这个概率分布的n个的样本集，带入蒙特卡罗求和的式子即可求解。但是还有一个关键的问题需要解决，即如何基于这个概率分布的采样得到这n个的样本集。

2.1 概率分布采样

对于常见的均匀分布uniform(0，1)是非常容易采样样本的，一般通过线性同余发生器可以很方便的生成(0，1)之间的伪随机数样本。而其他常见的概率分布，无论是离散的分布还是连续的分布，它们的样本都可以通过uniform(0，1)的样本转换而得。比如二维正态分布的样本(Z1，Z2)可以通过通过独立采样得到的uniform(0，1)样本对(U1，U2)通过如下的式子Box-Muller变换而得：

除了正态分布之外，还有很多其他常见的连续分布（如t分布，F分布，Beta分布，Gamma分布等）也可以用均匀0-1分布来表示，不过很多时候我们的分布并不是常见的分布，这也就以为着无法通过这些转换来获得样本集的概率分布。

不过很多时候，我们遇到的概率分布不是常见的分布，这意味着我们没法方便的得到这些非常见的概率分布的样本集。那这个问题怎么解决呢？

2.2 接受-拒绝采样

对于上述问题，可以考虑采用接受-拒绝采样来得到该分布的样本。既然p(x)太复杂在程序中没法直接采样，那么我设定一个程序可采样的分布 q(x) 比如高斯分布，然后按照一定的方法拒绝某些样本，以达到接近 p(x) 分布的目的，其中q(x)叫做 proposal distribution。

具体操作如下，设定一个方便抽样的函数 q(x)，以及一个常量 k，使得 p(x) 总在 kq(x) 的下方。（参考上图）

1）x 轴方向：从 q(x) 分布抽样得到 z。

2）y 轴方向：从均匀分布（0，kq(z)) 中抽样得到 u。

3）如果刚好落到灰色区域： u > p(z)，拒绝，否则接受这次抽样。

4）重复以上过程得到n个接受的样,z0,z1,z2…z(n-1);

5）最后的蒙特卡罗方法求解结果为：

整个过程中，我们通过一系列的接受拒绝决策来达到用q(x)模拟概率p(x)分布的目的。

三、小结

使用接受-拒绝采样，我们可以解决一些概率分布不是常见的分布的时候，得到其采样集并用蒙特卡罗方法求和的目的。但是接受-拒绝采样也只能部分满足我们的需求，在很多时候我们还是很难得到我们的概率分布的样本集。比如：

1）对于一些二维分布p(x，y)，有时候我们只能得到条件分布p(x|y)和p(y|x)和，却很难得到二维分布p(x，y)一般形式，这时我们无法用接受-拒绝采样得到其样本集。

2）对于一些高维的复杂非常见分布p(x1，x2，...，xn)，我们要找到一个合适的q(x)和k非常困难。

主要来自：https://www.cnblogs.com/jiangxinyang/p/9358822.html

附件一：

1、Box-Muller变换原理链接：https://blog.csdn.net/weixin_41793877/article/details/84700875

2、对于以下不等式的解释：

最后一步转换，左侧积分可以看做是f(x)/p(x)基于概率分布p(x)的期望，可以通过求解期望的平均方式来求解，即是f(x)/p(x)基于分布p(x)的采样点，然后再求平局值得到。

附件二：手写练习

猜你喜欢

转载自www.cnblogs.com/yifanrensheng/p/12729160.html

【ML-17-1】MCMC--蒙特卡罗方法（Monte Carlo）

蒙特卡罗(Monte Carlo)方法简介

蒙特卡罗方法（Monte Carlo method）

蒙特卡罗 Monte Carlo 方法简介

Monte Carlo

蒙特卡罗模拟概述(Monte Carlo Simulation)

matlab--蒙特卡罗Monte Carlo

蒙特卡罗法 (Monte Carlo Methods)

连续蒙特卡罗方法(Sequential Monte Carlo Methods)

蒙特卡罗(Monte Carlo)方法求圆周率

强化学习系列（五）：蒙特卡罗方法（Monte Carlo)

增强学习（四） ----- 蒙特卡罗方法(Monte Carlo Methods)

蒙特卡洛方法（Monte Carlo method，也有翻译成“蒙特卡罗方法”）

Monte Carlo simulated annealing

Monte Carlo Integration

Monte Carlo Methods

Monte Carlo Tree Search

Monte Carlo Control

Monte Carlo Policy Evaluation

Monte-Carlo Dropout

MCMC Lab 3: Markov chain Monte Carlo

Algorithm之MC：Monte Carlo method蒙特·卡罗方法的简介、实现、应用

（Monte Carlo）蒙特卡罗方法计算圆周率π（java实现）

强化学习笔记-05 蒙特卡罗方法Monte Carlo Method

蒙特卡洛方法（Monte Carlo Method）（5）

蒙特卡洛(Monte Carlo)方法简介

5 蒙特卡洛方法（Monte Carlo Method）

Chapter 5 Monte Carlo Methods

Matlab--Monte Carlo simulation

Monte Carlo methods for improved rendering

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)