《数学之美》之算法更新

目录

一、隐形马尔科夫模型

(1)马尔科夫假设: 

(2)隐形马尔科夫模型

(3)公式推导

(4)举例——通信的解码问题

(5)关于隐形马尔科夫模型的三个基本问题和训练问题

5.1 三个问题

5.2 对应的解决方法

5.3 隐形马尔科夫模型的训练问题

二、统计语言模型的工程诀窍

(1)基础知识

(2)解决零概率问题——古德-图灵估计

三、贝叶斯网络

1. 基础信息

2. 贝叶斯网络的训练

2.1 结构训练

2.2 参数训练——EM?最大熵?

四、条件随机场

五、EM算法


一、隐形马尔科夫模型

(1)马尔科夫假设: 

(2)隐形马尔科夫模型

由一个隐含的状态,即一个典型的马尔科夫链和独立输出假设组成

(3)公式推导

其中         

(4)举例——通信的解码问题

利用贝叶斯公式把上式转化为:

一旦 然后就可以使用上面的隐形马尔科夫模型了。

注意本例子是要求解这个公式的最大值,接下来可以使用维特比算法来计算最大值。

(5)关于隐形马尔科夫模型的三个基本问题和训练问题

5.1 三个问题

5.2 对应的解决方法

1.  Forward-Backward算法 

2. 维特比算法

3. 模型训练问题,5.3节详细讨论。

5.3 隐形马尔科夫模型的训练问题

如果直接根据人工标注的数据来训练,那么就是有监督的训练方法(Supervised Training)

在有些情况下做不到,所以

般不能保证找到全局最优点。

二、统计语言模型的工程诀窍

(1)基础知识

不管是机器翻译还是语音识别,都可以用到以下的诀窍:

利用一个简单的统计模型解决这个问题,贾里尼克的出发点就是“一个句子是否合理,就看他的可能性大小如何,至于可能性就用概率来衡量”

根据条件概率:

根据马尔科夫模型:

  该统计语言模型是二元模型。

具体计算方式:(根据大数定理)

(2)解决零概率问题——古德-图灵估计

统计语言模型的零概率问题无法避免:


具体的公式见书P35

三、贝叶斯网络

1. 基础信息

贝叶斯网络是有向图

2. 贝叶斯网络的训练

2.1 结构训练

2.2 参数训练——EM?最大熵?

四、条件随机场

五、EM算法

用了一个类似于“KD树”的例子来说了EM算法,很简单。

猜你喜欢

转载自blog.csdn.net/zhengbq_seu/article/details/81537887