几个常用机器学习算法 - 隐马尔可夫模型

1

先引入一个知乎上看到的例子：

假设你的手中有三个不同的骰子。
第一个是我们平常都能见到的骰子（称其为D6），6个面，每个面（1，2，3，4，5，6）出现的概率是1/6；
第二个有4个面（称其为D4），每个面（1，2，3，4）出现的概率是1/4；

第三个有8个面（称其为D8），每个面（1，2，3，4，5，6，7，8）出现的概率是1/8。

现在你要开始掷骰子了。
先从三个骰子里挑一个，挑到每一个骰子的概率都是1/3。
接着掷骰子，得到1，2，3，4，5，6，7，8中的一个点数。
你不停地重复上述过程，会得到一串数字，每个数字都是1，2，3，4，5，6，7，8中的一个。例如你得到了这么一串数字（掷了10次）：1 6 3 5 2 7 3 5 2 4

这串掷出的骰子点数叫做可见状态链。但是在隐马尔可夫模型中，我们不仅仅有这么一串可见状态链，还有一串隐含状态链。
在这个例子里，这串隐含状态链就是你用的骰子的序列，比如隐含状态链有可能是：D6 D8 D8 D6 D4 D8 D6 D6 D4 D8

一般来说，HMM中说到的马尔可夫链是指隐含状态链，因为隐含状态（骰子）之间存在转换概率（transition probability）。
在上面的例子中，D6的下一个状态是D4，D6，D8的概率都是1/3。D4，D8的下一个状态是D4，D6，D8的转换概率也都一样是1/3。你可以更改转换概率，那就是新的HMM了。

尽管可见状态之间没有转换概率，但是隐含状态和可见状态之间有一个概率叫做输出概率（emission probability）。
上面的例子中，六面骰（D6）产生1的输出概率是1/6。产生2，3，4，5，6的概率也都是1/6。

扫描二维码关注公众号，回复： 1824156 查看本文章