条件随机场CRF介绍 - 代码天地

条件随机场CRF介绍

其他 2018-05-22 17:11:43 阅读次数: 2

链接：https://mp.weixin.qq.com/s/BEjj5zJG3QmxvQiqs8P4-w

softmax

CRF主要用于序列标注问题，可以简单理解为是给序列中的每一帧，既然是分类，很自然想到将这个序列用CNN或者RNN进行编码后，接一个全连接层用softmax激活，如下图所示

逐帧softmax并没有直接考虑输出的上下文关联

条件随机场

然而，当我们设计标签时，比如用s、b、m、e的4个标签来做字标注法的分词，目标输出序列本身会带有一些上下文关联，比如s后面就不能接m和e，等等。逐标签softmax并没有考虑这种输出层面的上下文关联，所以它意味着把这些关联放到了编码层面，希望模型能自己学到这些内容，但有时候会“强模型所难”。

而CRF则更直接一点，它将输出层面的关联分离了出来，这使得模型在学习上更为“从容”：

扫描二维码关注公众号，回复： 981300 查看本文章

CRF在输出端显式地考虑了上下文关联

数学

当然，如果仅仅是引入输出的关联，还不仅仅是CRF的全部，CRF的真正精巧的地方，是它以路径为单位，考虑的是路径的概率。

模型概要

假如一个输入有 $n$

$n$

4tag分词模型中输出网络图

而在序列标注任务中，我们的正确答案是一般是唯一的。比如“今天天气不错”，如果对应的分词结果是“今天/天气/不/错”，那么目标输出序列就是bebess，除此之外别的路径都不符合要求。换言之，在序列标注任务中，我们的研究的基本单位应该是路径，我们要做的事情，是从 $k^{n}$

这就是逐帧softmax和CRF的根本不同了：前者将序列标注看成是 $n$ 问题，后者将序列标注看成是 $1$ 问题。

具体来讲，在CRF的序列标注问题中，我们要计算的是条件概率

为了得到这个概率的估计，CRF做了两个假设：

假设一 该分布是指数族分布。

这个假设意味着存在函数 $f (y_{1}, \dots, y_{n}; x)$

$f (y_{1}, \dots, y_{n}; x)$

其中 $Z (x)$

假设二 输出之间的关联仅发生在相邻位置，并且关联是指数加性的

这个假设意味着f(y₁,…,y_n;x) $f (y_{1}, \dots, y_{n}; x)$

$f (y_{1}, \dots, y_{n}; x)$

这也就是说，现在我们只需要对每一个标签和每一个相邻标签对分别打分，然后将所有打分结果求和得到总分。

线性链CRF

管已经做了大量简化，但一般来说，上 $(3)$

这时候 $g$

$g$

这就是线性链CRF的概念。

归一化因子

为了训练CRF模型，我们用最大似然方法，也就是用

作为损失函数，可以算出它等于

其中第一项是原来概率式的分子的对数，它目标的序列的打分，虽然它看上去挺迂回的，但是并不难计算。真正的难度在于分母的对数 $\log Z (x)$

归一化因子，在物理上也叫配分函数，在这里它需要我们对所有可能的路径的打分进行指数求和，而我们前面已经说到，这样的路径数是指数量级的（ $k^{n}$

事实上，归一化因子难算，几乎是所有概率图模型的公共难题。幸运的是，在CRF模型中，由于我们只考虑了临近标签的联系（马尔可夫假设），因此我们可以递归地算出归一化因子，这使得原来是指数级的计算量降低为线性级别。具体来说，我们将计算到时刻 $t$

$t$

其中 $Z_{t}^{(1)}, \dots, Z_{t}^{(k)}$ 分别是截止到当前时刻 $t$

它可以简单写为矩阵形式

G

归一化因子的递归计算图示。从t到t+1时刻的计算，包括转移概率和j+1节点本身的概率

动态规划

写出损失函数 $- \log P (y_{1}, \dots, y_{n} | x)$

猜你喜欢

转载自www.cnblogs.com/skykill/p/9072047.html

条件随机场CRF介绍

条件随机场专题（1）--CRF介绍

条件随机场CRF

条件随机场（crf）

条件随机场(CRF)

CRF条件随机场

条件随机场_CRF

CRF条件随机场总结

条件随机场（CRF）的理解

条件随机场（CRF）笔记

【算法】CRF(条件随机场)

条件随机场-CRF (1)

条件随机场-CRF (3)

条件随机场-CRF (2)

条件随机场CRF(二)

条件随机场CRF(一)

条件随机场CRF(三)

CRF条件随机场的理解

条件随机场(CRF) 简介

条件随机场CRF的理解

简明条件随机场CRF介绍 | 附带纯Keras实现

简明条件随机场CRF介绍（附带纯Keras实现）

马尔可夫随机场MRF与条件随机场CRF

[转]CRF条件随机场简介

条件随机场（CRF）模型理解

条件随机场CRF HMM,MEMM的区别

TensorFlow学习（十四）：条件随机场CRF

条件随机场专题（2）--CRF模型

CRF条件随机场与HMM，MEMM比较

【IM】关于条件随机场CRF的理解

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)