Bilstm+crf中的crf详解 - 代码天地

Bilstm+crf中的crf详解

其他 2018-09-24 12:16:57 阅读次数: 0

版权声明：转载请注明博客地址谢谢。 https://blog.csdn.net/buppt/article/details/82227030

本文是对bilstm+crf模型中的crf进行讲解，并不是完整的条件随机场的讲解。

如果对命名实体识别还不清楚的同学，可以先看这篇文章。代码在这里。

模型如下图所示。

我们已知lstm的输出就是每个字标注的概率。假设lstm输出概率如下所示。这里为了方便，只写了 BMEO 4种标注结果。更多的话也是相同的。

而crf首先在每句话的前面增加一个<start>字，在每句话的结尾增加一个<end>字。

然后定义了一个转移矩阵，转移矩阵中的数值代表前面一个字标注结果到下一个字的标注结果的概率。比如下面矩阵中的第一行，代表的含义就是前一个字标注为start，下一个字标注为B 的概率是0.6，标注为O的概率就是0.4。这个矩阵是随机初始化的，里面的数值也是通过梯度下降自动更新的。

然后又定义了“路径”这个概念，一句话的每一种标注结果就代表一个路径。下图就代表两条路径。

每条路径的分数 P=e^s
s = 初试分数 + 转换分数
初试分数 = 路径上lstm输出分数和
转换分数 = 路径上转换矩阵分数和

我们要找的就是分数最大的那一条路径，就可以得到这句话每个字的标注结果，然后就可以通过BME规则把实体抽取出来了。我们定义crf的损失函数如下。

然后就可以通过pytorch提供的

loss.backward()
optimizer.step()

进行训练了。

这里有一个写代码时候的算法优化，因为要计算所有路径的分数，一个一个算时间复杂度太高了，计算时候一个字一个字的计算，计算下一个字的时候，只用前一个字的分数就行了。

猜你喜欢

转载自blog.csdn.net/buppt/article/details/82227030

Bilstm+crf中的crf详解

CRF以及BiLSTM+CRF

BiLSTM+CRF

BiLSTM+CRF（Keras）

BiLSTM+CRF 实体识别

HMM->MEMM->CRF以及BiLSTM+CRF中的CRF层

【算法】BILSTM+CRF中的条件随机场

实习点滴（10）--BiLstm+CRF介绍

BiLSTM+CRF (一）双向RNN 浅谈

deep learning 08. biLSTM+CRF

基于BiLSTM+CRF 实体识别

NER学习系列之-BILSTM+CRF

好文章bilstm+crf

命名实体识别（biLSTM+crf）

Bilstm+crf ner[pytorch,keras]

BiLSTM-CRF中CRF层的作用

BiLSTM+CRF(二）命名实体识别

BILSTM+CRF实现命名实体识别NER

用BILSTM+CRF模型进行命名实体识别

【NLP】命名实体识别NER——BiLSTM+CRF方法

Keras实现BiLSTM+CRF字符级序列标注

源码阅读笔记 BiLSTM+CRF做NER任务（一）

源码阅读笔记 BiLSTM+CRF做NER任务（二）

BiLSTM-CRF中CRF层解析-1

LSTM+CRF中CRF详解

BILSTM+CRF-LOSS

在TensorFlow RNN 深度学习下 BiLSTM+CRF 实现 sequence labeling

TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注

零基础入门--中文命名实体识别（BiLSTM+CRF模型，含代码）

TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注源码

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)