CRF层说明（以BI-LSTM为例）

其他 2019-04-01 02:02:35 阅读次数: 0

CRF层说明

如果没有CRF层

您可能已经发现，即使没有CRF层，如下图所示，换句话说，我们依然可以训练BiLSTM命名实体识别模型。
没有crfd层的BiLSTM模型
因为BiLSTM输出的每一个单词都是数据标签。对于每个单词我们都可以选择得分最高的标签。
举个例子，对于Wo,"B-Person"拥有最高的Score，因此我们可以选择“B-Person”作为其最佳预测标签。同样的，我们对于W1可以选择由此I-Person,对于W2选择“O”，类推W3,W4。
虽然在这个例子中我们可以为句子 x 获得正确的标签，但它并不总是那样，请再次尝试下图中的示例。
没有CRF的BiLSTM模型
显然，这次输出无效，“I-Organization I-Person”和“B-Organization I-Person”。

CRF层可以从训练数据中学习约束

CRF层可以为最终预测标签添加一些约束以确保它们有效。在训练过程中，CRF层可以自动从训练数据集中学习这些约束。

约束可能是以下几种:

句子中第一个单词的标签应以“B-”或“O”开头，而不是“I-”
B-label1 I-label2 I-label3 I- …“，在此模式中，label1，label2，label3 …应该是相同的命名实体标签。例如，“B-Person I-Person”有效，但“B-Person I-Organization”无效。
“O I-label”无效。一个命名实体的第一个标签应以“B-”而非“I-”开头，换句话说，有效模式应为“O B-label”
…
利用这些有用的约束，无效预测标签序列的数量将显着减少。

NEXT

在下一节中，我将分析CRF损失函数，以解释CRF层如何或为何可以从训练数据集中学习上述约束。
有人看继续写

猜你喜欢

转载自blog.csdn.net/weixin_38525326/article/details/88916711

CRF层说明（以BI-LSTM为例）

BI-LSTM and CRF using Keras

pytorch之BI-LSTM CRF（六）

Bi-LSTM学习

LSTM 双向 Bi-LSTM

高级教程: 作出动态决策和 Bi-LSTM CRF 重点

【Tensorflow】Bi-LSTM文本分类

Bi-LSTM的理解以及 Tensorflow实现

pytorch中的变长bi-lstm

Bi-LSTM+CRF理解

【RNN详解】SimpleRNN，LSTM，bi-LSTM的原理及Tensorflow实现

Bi-LSTM原理及TensorFlow实现序列标注

Pytorch：RNN、LSTM、GRU、Bi-GRU、Bi-LSTM、梯度消失、梯度爆炸

Bi-LSTM-CRF算法详解

学习：Bi-LSTM-CRF for Sequence Labeling

序列标注之Bi-LSTM-CRF

Keras examples-imdb_bidirectional_lstm[利用Bi-LSTM实现情感分类]

【自然语言处理】基于双向LSTM(Bi-LSTM)文本分类的Tensorflow实现

论文学习——基于改进Bi-LSTM和XGBoost的电力负荷组合预测方法

TextRNN、TextLSTM、Bi-LSTM循环神经网络代码实现

Bi-LSTM+CRF在文本序列标注中的应用

TensorFlow——Bi-LSTM+CRF进行序列标注（代码浅析）

Bi-lstm+CRF实现NER（训练生成词向量）

Bi-lstm+CRF实现NER（随机生成词向量）

Bi-LSTM+CRF模型精度提升记录

Quality-Estimation2 (翻译质量评价-在BERT模型后面加上Bi-LSTM进行fine-tuning)

命名实体识别LSTM+CRF中CRF层的理解

NLP（二十五）实现ALBERT+Bi-LSTM+CRF模型

nlp系列（7）三元组识别（Bi-LSTM+CRF）pytorch

文本分类实战（四）—— Bi-LSTM模型文本分类实战（一）—— word2vec预训练词向量

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)