Sequence Labeling Problem - 代码天地

Sequence Labeling Problem

其他 2018-08-14 14:18:32 阅读次数: 0

目录

Hidden Markov Model (HMM)

Conditional Random Field (CRF)

Structured Perceptron/SVM

Towards Deep Learning

链接：

http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2015_2/Lecture/Sequence%20(v4).pdf

对于序列模型，我们其实使用之前学的RNN是可以解决的，但是在POS tagging问题中，RNN并不知道整个句子的信息，单靠查表是不够的。比如对于同一个单词“saw”，它在名词后是一个动词，冠词后是一个名词。所以，我们需要考虑整个句子的信息才能确定tag应该是什么。这里给出了几种解决时间序列问题的方法。

Hidden Markov Model (HMM)

对于HMM，解决这类问题我们可以分为两步，第一步是基于语法知识产生一个POS序列；第二步是基于词典从中抽取对应语法的单词，从而实现将POS sequence向word sequence转换。

对于HMM的第一个问题Evaluation，我们可以用贝叶斯公式将其展开，再分别计算转移概率和发射概率。

具体举一个栗子，参照上面的公式应该能够明白怎么回事。

对于HMM的第二个问题Inference,已知观测状态求隐状态，此时我们不需要穷举所有可能出现的状态，我们使用维特比算法去解决。

对于HMM的问题三Training，我们可以从训练数据里面获得P(y), P(x|y)的概率。类似于这种。

HMM缺点

HMM转移概率和发射概率是相互独立的，特别爱浮想联翩，对于未出现的data不见得会给它一个比较低的概率，所有说当训练数据比较少的时候，效果可能会比较不错。但是一旦训练数据特别多的时候，这个效果就不会这么好了。所以说我们需要一个更复杂的模型，同时又跟HMM的模型很相似。

Conditional Random Field (CRF)

对于CRF，我们同样适用三个问题法来进行讨论。

对于CRF的问题一：Evaluation。

由公式可以知道P(x,y)与exp(w·o(x,y))是成正相关的。所以我们求得后面的公式即可。对于该公式的由来，我们可以从HMM开始推导。

该公式的三个式子可以表示为这三个。我们可以采用矩阵的乘法，变形就可以得到exp(w·o(x,y))。

对于这里的特征向量，我们可以自己定义表去求解，此处主要是两部分：tagsàwords, tagsàtags。

对于CRF的第二个问题Inference，我们依然可以采用维特比算法。

对于CRF的第三个问题Training，我们使用Gradient Ascent算法，对目标函数关于w求偏导，然后对其w进行更新。

CRF v.s. HMM

HMM不能够做到让观测状态的概率上升的同时让隐含状态的概率下降。CRF能够完成HMM更多不能够完成的工作。

Structured Perceptron/SVM

Structured Perceptron和CRF特别像，它们之间的不同就是再training这里。Structured Perceptron为hard，即减去最大可能出现的y(最大的错误概率的那个输出)；CRF为soft，即减去所有y可能出现的概率都做sum。

Structured SVM和Structured Perceptron不同之处在于需要考虑margin和error。

Towards Deep Learning

总体说来structured learning比RNN好，但是RNN能够特别深这是structured learning做不到的。所以我们一般是把两者结合起来使用。

小结

猜你喜欢

转载自blog.csdn.net/qq_18124075/article/details/81266133

Sequence Labeling Problem

sequence labeling笔记（一）

深度学习笔记——理论与推导之Structured Learning【Sequence Labeling Problem】（八）

学习：Bi-LSTM-CRF for Sequence Labeling

Implicitly-Defined Neural Networks for Sequence Labeling

论文阅读笔记：《Contextual String Embeddings for Sequence Labeling》

用序列标注Sequence Labeling来做event detection

flair embedding--《Contextual String Embeddings for Sequence Labeling》阅读笔记

Accelerating BERT Inference for Sequence Labeling via Early-Exit

HDU Problem - 5918 Sequence I

在TensorFlow RNN 深度学习下 BiLSTM+CRF 实现 sequence labeling

李宏毅机器学习课程笔记8：Structured Learning - Linear Model、Structured SVM、Sequence Labeling

TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注

TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注源码

番外.李宏毅学习笔记.ST4.Sequence Labeling

论文学习12-Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data（CRF

李宏毅机器学习课程笔记8：Structured Learning - Linear Model、Structured SVM、Sequence Labeling 李宏毅机器学习课程笔记8：Structured Learning - Linear Model、Structured SVM、Sequence Labeling

Sequence Problem (IV) : Function Practice (Append Code)

ZOJ Problem Set - 4027 Sequence Swapping （DP）

问题 K: Sequence Problem (III) : Array Practice

问题 J: Sequence Problem (II) : Array Practice

问题 I: Sequence Problem : Array Practice

【FOJ】Problem 1304 Recaman's Sequence

论文学习19-Structured prediction models for RNN based sequence labeling in clinical text(LSTM_CRF,2016)

论文学习20-End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF（序列标注，2016ACL

Water Sequence Problem By liuzhangfeiabc - 线段树 - 矩阵乘法

[AtCoder Grand Contest 024 Problem E]Sequence Growing Hard

日常训练赛 Problem C – Complete Naebbirac’s sequence

ZOJ Problem Set - 4104 Sequence in the Pocket(排序思维题)

Codeforces Round #690 (Div. 3), problem: (A) Favorite Sequence,

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)