Tagging Problems and Hidden Markov Models - 代码天地

Tagging Problems and Hidden Markov Models

其他 2018-05-24 07:13:26 阅读次数: 0

一，标注问题

1，基本定义

通常将源序列 $x_1,x_2,..,x_n$ 映射为标记序列 $y_1,y_2,...,y_n$ 的问题，称为序列标注问题或者标注问题。

序列对建模的任务就是从训练语料中学习一个函数可以将源序列映射为标记序列的函数。

2，两个经典的标注问题

（1）POS tagging(词性标注)

词性标注的难点在于：

词性的歧义。
罕见词的存在性，例如那些没在训练语料中出现的词语。

一般解决方法：

考虑每个词语词性的统计偏好。
利用每个词的上下文信息，上下文信息对一个词的词性有很大的影响。

（2）Named-Entity recognition(命名实体识别)

3，标注问题的学习方法

一般我们会把标注问题看做一个监督学习问题，如下：

（1）判别式模型（条件模型）

首先从训练样本中学习一个条件分布 $p(y|x)$ ；
给一个测试样本x，则预测的标记序列为 $f(x)=argmax_yp(y|x)$ 。

（2）生成式模型（联合模型）

首先从训练样本中学习一个联合分布 $p(x,y)=p(y)p(x|y)$ 。
给一个测试样本x，则预测的标记序列为
$\begin{aligned} f (x) & = a r g m a x_{y} p (y | x) \\ = a r g m a x_{y} \frac{p (y) p (x | y)}{p (x)} \\ = a r g m a x_{y} p (y) p (x | y) \end{aligned}$ $\begin{align*} f(x) &= argmax_y p(y|x)\\ &=argmax_y \frac{p(y)p(x|y)}{p(x)}\\ &=argmax_y p(y)p(x|y) \end{align*}$
其中，真正需要估计的模型参数只有 $p(y)和p(x|y)$ ，相比判别式模型，复杂度减少了很多。

其实，通常把将一个联合分布 $p(x,y)$ 分解成 $p(y)和p(x|y)$ 两部分的模型，称为噪声信道模型。其中 $p(x|y)$ 可以看成一个将标记y作输入，经过一些噪声破坏它，最后生成x作为输出的信道。

NLP中有很多问题如标注问题、机器翻译、语音识别等，通常都是使用生成式模型来解决的。

总结如下：

4，生成式标注模型

下面将会详细回答这三个问题：

使用Trigram HMMs定义一个生成式标注模型。
使用线性插值最大似然估计来估计模型参数。
使用Viterbi算法来高效地寻找给定句子的最优标注序列，即解码问题。

二，HMM

1，Trigram HMMs

推导过程主要用到了：

链式法则；
马尔可夫假设；
独立性假设。

该模型的生成过程如下：

2，Trigram HMMs的参数估计

（1）对于监督学习

参数估计方法：最大似然估计+平滑方法。
使用最大似然估计，我们可以得到参数估计值为：

q (s | u, v) = \frac{c (u, v, s)}{c (u, v)}

$q(s|u,v)=\frac{c(u,v,s)}{c(u,v)}$

e (x | s) = \frac{c (s - > x)}{c (s)}

$e(x|s)=\frac{c(s->x)}{c(s)}$

为了避免零概率问题， $q(s|u,w)$ 的估计可以使用一些语言模型那一章介绍的平滑方法，如线性插值法；而 $e(x|s)$ 的估计则需要如下的方法来解决。
处理低频词的一般方法如下：

例如：

（2）对于无监督学习

对于无监督学习，则需要使用Baum-Welch算法(核心是EM算法)来估计参数。因为这里把标注问题看成了一个监督学习的问题，所以这里就不详细介绍EM了，可以参考李航老师的《统计学习方法》P181。

3，使用Viterbi算法对Trigram HMMs进行高效解码

这是一个动态规划算法，该算法的核心就是理解Viterbi变量的定义和动态方程，没有想象的那么难。
一些定义如下：

算法过程如下：

算法的时间复杂度如下：

猜你喜欢

转载自blog.csdn.net/h2026966427/article/details/79903665

Tagging Problems and Hidden Markov Models

NLP 学习笔记 02 Tagging Problems and Hidden Markov Models

HMM（Hidden Markov Models）

Hidden Markov Models笔记

隐含马尔可夫模型——Hidden Markov models (HMM)

语音识别——隐马尔科夫模型(Hidden Markov Models)

机器学习算法之——隐马尔可夫模型(Hidden Markov Models,HMM)

Hidden Markov Model - A Tutorial

MEMMs(Log-Linear Tagging Models)

Bidirectional LSTM-CRF Models for Sequence Tagging

深度学习（七）Hidden Markov Model

【MMUB】基于Hidden Markov model的手机用户行为建模——Hidden Markov model

Bidirectional LSTM-CRF Models for Sequence Tagging阅读笔记

Paper: Bidirectional LSTM-CRF Models for Sequence Tagging

文献阅读 - Bidirectional LSTM-CRF Models for Sequence Tagging

隐马尔可夫模型（Hidden Markov Model）

隐马尔可夫模型hidden Markov model

隐马尔科夫模型(hidden Markov model)

隐马尔可夫模型 (Hidden Markov Model，HMM)

隐马尔科夫模型(Hidden Markov Model,HMM)

隐马尔可夫模型（Hidden Markov Model, HMM)

隐马尔科夫模型（Hidden Markov Model）

隐马尔科夫模型（Hidden Markov Model，HMM）

隐马尔可夫模型(Hidden Markov Model，HMM)

隐马尔可夫模型 Hidden Markov Model

隐马尔科夫模型 HMM(Hidden Markov Model)

隐马尔科夫模型Hidden Markov Model (HMM)

2000_wideband extension of telephone speech using a hidden Markov model

机器学习 - 命名实体识别之Hidden Markov Modelling

Hidden Markov Model (HMM) 详细推导及思路分析

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)