HMM：隐马尔科夫模型 - 预测和解码

其他 2018-05-16 10:22:27 阅读次数: 2

http://blog.csdn.net/pipisorry/article/details/78397567

CRF的学习

即CRF的参数估计问题。条件随机场模型实际上是定义在时序数据上的对数线性模型（LR模型同样是），其学习方法包括极大似然估计和正则化的极大似然估计。具体的优化实现算法有改进的迭代尺度法IIS、梯度下降法以及拟牛顿法。

改进的迭代尺度法(IIS)

已知训练数据集，由此可知经验概率分布，可以通过极大化训练数据的对数似然函数来求模型参数。

训练数据的对数似然函数为（lz条件熵）

当Pw是条件随机场模型时

IIS通过迭代的方法不断优化对数似然函数改变量的下界，达到极大化对数似然函数的目的。

假设模型的当前参数向量为w=(w₁,w₂, ..., w_K)^T，向量的增量为δ=(δ1,δ2, ..., δK)^T，更新参数向量为w +δ=(w₁+δ1, w₂ +δ2, ..., w_k +δk)^T。在每步迭代过程中，IIS通过一次求解下面的11.36和11.37，得到δ=(δ1,δ2, ..., δK)^T。

关于转移特征t_k的更新方程为：

关于状态特征s_l的更新方程为：

这里T(x, y)是在数据(x, y)中出现所有特征数的综合：

于是算法整理如下。

算法：条件随机场模型学习的改进的迭代尺度法

输入：特征函数t₁,t₂, ..., t_K1，s1, s2, ..., s_K2；经验分布

输出：参数估计值；模型。

过程：

拟牛顿法

对于条件随机场模型

学习的优化目标函数是

其梯度函数是

算法：条件随机场模型学习的BFGS算法(拟牛顿法)

前向后向算法

像隐马尔可夫模型那样，引进前向-后向向量，递归的计算以上概率及期望值。这样的算法称为前向-后向算法。

前向-后向算法

对每个指标i =0,1,...,n+1，定义前向向量a_i(x)：

递推公式为

又可表示为

a_i(y_i|x)表示在位置i的标记是y_i并且到位置i的前部分标记序列的非规范化概率，若y_i可取的值有m个，那a_i(x)就是m维的列向量。

同样，对每个指标i =0,1,...,n+1，定义后向向量β_i(x)：

又可表示为

β_i(y_i|x)表示在位置i的标记为y_i并且从i+1到n的后部分标记序列的非规范化的概率。

由前向-后向定义不难得到：

这里，若a_i(x)是m维的列向量，那1就是元素均为1的m维列向量。

概率计算

按照前向-后向向量的定义，很容易计算标记序列在位置i是标记yi的条件概率和在位置i-1与i是标记y_i-1和y_i的条件概率：

其中，

Z(x)= a_n^T(x)·1

期望值计算

利用前向-后向向量，可以计算特征函数关于联合分布P(X, Y)和条件分布P(Y | X)的数学期望。

特征函数f_k关于条件分布P(Y |X)的数学期望是

其中，

Z(x)= a_n^T(x)·1

假设经验分布为

则特征函数f_k关于联合分布P(X, Y)的数学期望是

其中，

Z(x)= a_n^T(x)·1

式11.23和式11.35是特征函数数学期望的一般计算公式。对于转移贴纸t_k(y_i-1, y_i, x, i)，k=1,2,...,K₁，可以将式中的f_k换成t_k；对于状态特征，可以将式中的f_k换成s_i，表示s_l(y_i, x, i)，k = K₁ +1，l = 1,2,...,K₂。

有了式11.32 ~11.35，对于给定的观测序列x和标记序列y，可以通过一次前向扫描计算a_i及Z(x)，通过一次后向扫描计算βi，从而计算所有的概率和特征的期望。

CRF的预测算法

条件随机场的预测问题是给定义条件随机场P(Y|X)和输入序列(观测序列)x，求条件概率最大的输出序列(标记序列)y*，即对观测序列进行标注。条件随机场的预测算法是著名的维特比算法。

由

可得：

于是，条件随机场的预测问题成为求非规范化概率最大的最优路径问题。

算法：条件随机场预测的维特比算法

维特比算法建议看看HMM中的算法示例[HMM：隐马尔科夫模型 - 预测和解码 ]，根据非规范化条件概率计算示例1

这样CRF中的维特比算法就是一样的了。

from: http://blog.csdn.net/pipisorry/article/details/78397567

ref: [统计学习方法]

猜你喜欢

转载自blog.csdn.net/sinat_22510827/article/details/80194717

HMM：隐马尔科夫模型 - 预测和解码

hmm前后向算法隐马尔科夫模型HMM（三）鲍姆-韦尔奇算法求解HMM参数隐马尔科夫模型HMM（四）维特比算法解码隐藏状态序列隐马尔科夫模型HMM（一）HMM模型

隐马尔科夫模型（四）预测算法

隐马尔科夫模型-HMM

隐马尔科夫模型(HMM)

隐马尔科夫模型（HMM）

隐马尔科夫模型HMM

HMM隐马尔科夫模型

隐马尔科夫(HMM)模型

HMM（隐马尔科夫模型）

炎热天气看书还是钓鱼？隐马尔科夫模型教你预测！

机器学习 - 隐马尔科夫模型（4）- 预测算法

【机器学习】隐马尔科夫模型（下）——学习算法和预测算法

隐马尔科夫模型HMM（一）HMM模型

机器学习算法 10 —— HMM模型(马尔科夫链、前向后向算法、维特比算法解码、hmmlearn)

马尔科夫预测

马尔科夫预测模型（超详细，案例代码）

概率模型（三）：隐马尔科夫模型HMM

HMM模型(隐马尔科夫模型)的简单尝试

【ML-13-4】隐马尔科夫模型ＨＭＭ--预测问题Viterbi（维特比）算法

中文分词之隐马尔科夫模型（HMM）

机器学习-HMM(对隐马尔科夫模型的理解)

隐马尔科夫模型(HMM)浅见

隐马尔科夫模型HMM自学（3）

隐马尔科夫模型HMM自学（2）

隐马尔科夫模型（HMM)及其扩展

隐马尔科夫模型--HMM和Viterbi算法

HMM隐马尔科夫模型二--学习算法

隐马尔科夫模型-HMM和Viterbi算法

机器学习-隐马尔科夫模型（HMM）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)