马尔可夫模型

       安德雷·安德耶维齐·马尔可夫(A.A.Markov,1856-1922),彼得堡数学学派的代表任务,以数论和概率论方面的工作著称,其以马尔可夫假设而得名。

背景介绍

      19世纪初,概率论的发展从对(相对静态的)随机变量的研究发展到对随机变量的时间序列$s_1$,$s_2$,...$s_t$,...,即随机过程(动态)的研究。在数学上,这是工具的升级;在哲学上,这是人类认知的一个飞跃。随机过程比随机变量复杂得多。首先,在任何一个时刻$t$,其所对应的状态$s_i$是随机的。再者,任何一个状态$s_t$的取值都可能和周围其它的状态相关。

马尔可夫链

      在上述背景中,介绍了随机过程中状态序列分析的复杂性。在这里,假设存在一个时间序列$s_1$,$s_2$,...$s_t$,现在我们要计算该序列成的概率,即要求:

$P(s_1s_2$...$s_t)$的值。依据条件概率公式,可得:

$P(s_1s_2$...$s_t)=P(s_1)P(s_2|s_1)P(s_3|s_1s_2)$...$P(s_t|s_1s_2...s_{t-1})$

上面这个式子是没有什么问题的,但是对于它的计算就存在一些障碍。首先,$P(s_1)$、$P(s_2|s_1)$、$P(s_3|s_1s_2)$的计算是可以接受的。但随着$t$的增大,越到后面,计算量就越大。因此,对于这个公式只能进行估算。

      马尔可夫链就是这样一种工具,假设在随机过程中各个状态$s_t$的概率分布只与其前一个状态$s_{t-1}$,而与其它状态无关,即:

$P(s_t|s_1s_2...s_{t-1})$=$P(s_t|s_{t-1})$。

有了这么一个假设,之前的公式计算就变得可能了:

$P(s_1s_2$...$s_t)=P(s_1)P(s_2|s_1)P(s_3|s_2)$...$P(s_t|s_{t-1})$

 上述的假设仅仅是对时间序列的状态做的一种近似估计,当然并不是所有的应用都会符合这种假设。这个假设被命名为马尔可夫假设,凡是符合该假设的随机过程便称之为马尔可夫过程,也称为马尔可夫链。

扫描二维码关注公众号,回复: 1948115 查看本文章

猜你喜欢

转载自www.cnblogs.com/heaveneleven/p/9280153.html