机器学习之蒙特卡洛方法

1、蒙特卡洛方法概述

　　蒙特卡罗原来是一个赌场的名称，用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法，这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题。比如积分：　　

　　如果此时f(x)很难求出其原函数时，那么这个积分就非常难求。当然我们可以通过蒙特卡洛方法来模拟求解近似值，假设我们的函数f(x)如下图所示

　　则一个简单的近似求解方法是在[a，b]之间随机的采样一个点。比如 $x_{0}$

$x_{0}$

　　则近似解可以表示为

　　1/n [f(x₀)/p(x₀) + f(x₁)/p(x₁) + ... + f(x_n-1)/p(x_n-1)]

$x_{0}$

$x_{0}$

　　除了正态分布之外，还有很多其他常见的连续分布也可以用均匀0-1分布来表示，不过很多时候我们的分布并不是常见的分布，这也就以为着无法通过这些转换来获得样本集的概率分布。

3、接受-拒绝采样

　　对于概率分布不是常见的分布，一个可行的办法是采用接受-拒绝采样来得到该分布的样本。既然 $p (x)$

　　具体操作如下，设定一个方便抽样的函数 q(x)，以及一个常量 k，使得 p(x) 总在 kq(x) 的下方。（参考上图）

　　　　1）x 轴方向：从 q(x) 分布抽样得到 a。

　　　　2）y 轴方向：从均匀分布（0，kq(a)) 中抽样得到 u。

　　　　3）如果刚好落到灰色区域： u > p(a)，拒绝，否则接受这次抽样。

　　　　4）重复以上过程。

4、小结

　　使用接受-拒绝采样，我们可以解决一些概率分布不是常见的分布的时候，得到其采样集并用蒙特卡罗方法求和的目的。但是接受-拒绝采样也只能部分满足我们的需求，在很多时候我们还是很难得到我们的概率分布的样本集。比如：

　　　　1）对于一些二维分布 $p (x, y)$ ，有时候我们只能得到条件分布 $p (x | y)$ 一般形式，这时我们无法用接受-拒绝采样得到其样本集。

　　　　2）对于一些高维的复杂非常见分布 $p (x_{1}, x_{2}, . . ., x_{n})$ $p (x | y)$