马尔科夫链和隐马尔科夫模型

首先将其基本的概率进行讲解：

马尔科夫性质（Markov property）：简单的说，就是当一个随机过程在给定现在状态及所有过去状态情况下，其未来状态的条件概率分布仅依赖于当前状态。换句话说，在给定现在状态时，它与过去状态（即该过程的历史路径）是条件独立的（也就是没有任何的关系），那么此随机过程即具有马尔可夫性质。具有马尔可夫性质的过程通常称之为马尔可夫过程。

马尔可夫链（Markov chain），又称离散时间马尔可夫链（discrete-time Markov chain，缩写为DTMC），为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质：下一状态的概率分布只能由当前状态决定，在时间序列中它前面的事件均与之无关。也就是马尔可夫性质。在马尔可夫链的每一步，系统根据概率分布，可以从一个状态变到另一个状态，也可以保持当前状态。状态的改变叫做转移，与不同的状态改变相关的概率叫做转移概率。

隐马尔可夫模型（Hidden Markov Model，HMM）是统计模型，它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数，然后利用这些参数来作进一步的分析。在正常的马尔可夫模型中，状态对于观察者来说是直接可见的。这样状态的转移概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的，但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。

其使用主要三个种类：

预测(filter)：已知模型参数和某一特定输出序列，求最后时刻各个隐含状态的概率分布。

平滑(smoothing)：已知模型参数和某一特定输出序列，求中间时刻各个隐含状态的概率分布. 通常使用forward-backward 算法解决。

解码(most likely explanation): 已知模型参数，寻找最可能的能产生某一特定输出序列的隐含状态的序列，通常使用Viterbi算法解决。

三类的具体实际例子在这个地址里面有讲解：https://www.cnblogs.com/skyme/p/4651331.html

马尔可夫决策过程(Markov Decision Process, MDP)也具有马尔可夫性，与上面不同的是MDP考虑了动作，即系统下个状态不仅和当前的状态有关，也和当前采取的动作有关。举下棋的例子，当我们在某个局面（状态s）走了一步(动作a)，这时对手的选择（导致下个状态s’）我们是不能确定的，但是他的选择只和s和a有关，而不用考虑更早之前的状态和动作，即s’是根据s和a随机生成的。

概念来自于维基百科

--------------------- 本文来自 Cute_zhugoing 的CSDN 博客，全文地址请点击：https://blog.csdn.net/Cute_zhugoing/article/details/79747992?utm_source=copy

马尔科夫链和隐马尔科夫模型

猜你喜欢