序列标注总结 - 代码天地

序列标注总结

其他 2019-12-30 20:34:11 阅读次数: 0

序列标注一般可以分为两类：

1、原始标注（Raw labeling）：每个元素都需要被标注为一个标签。

2、联合标注（Joint segmentation and labeling）：所有的分段被标注为同样的标签。

命名实体识别（Named entity recognition， NER）是信息提取问题的一个子任务，需要将元素进行定位和分类，如人名、组织名、地点、时间、质量等。

举个NER和联合标注的例子。一个句子为：Yesterday , George Bush gave a speech. 其中包括一个命名实体：George Bush。我们希望将标签“人名”标注到整个短语“George Bush”中，而不是将两个词分别标注。这就是联合标注。

BIO标注

解决联合标注问题的最简单的方法，就是将其转化为原始标注问题。标准做法就是使用BIO标注。

BIO标注：将每个元素标注为“B-X”、“I-X”或者“O”。其中，“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头，“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置，“O”表示不属于任何类型。

比如，我们将 X 表示为名词短语（Noun Phrase, NP），则BIO的三个标记为：

（1）B-NP：名词短语的开头

（2）I-NP：名词短语的中间

（3）O：不是名词短语

因此可以将一段话划分为如下结果;

我们可以进一步将BIO应用到NER中，来定义所有的命名实体（人名、组织名、地点、时间等），那么我们会有许多 B 和 I 的类别，如 B-PERS、I-PERS、B-ORG、I-ORG等。然后可以得到以下结果：

猜你喜欢

转载自www.cnblogs.com/shona/p/12121473.html

序列标注总结

序列标注（Sequence Tagging） NLP | 序列标注总结

NLP 序列标注总结（没有比较好的总结，我的就是第一）

序列标注

序列标注的BIO标注体系

【序列标注】kaggle实战系列-序列标注

序列标注相关方案

序列模型标注

HMM与序列标注

序列标注（HMM/CRF）

HMM用于序列标注

什么是序列标注

序列标注理解

序列标注中的BIO标注介绍

实体标注、序列标注工具-BIO方式

brat标注工具知识总结

实体识别：序列标注规则

序列标注中的标签方案

LSTM(序列标注，自实现）

序列标注（三）——模型对比

图片数据标注工具与平台（数据标注公司）总结

「总结」区间/序列题型总结

关于任务二(用户兴趣标注)的总结

深度学习——常用数据标注工具总结

各种序列话总结

时间序列统计总结

时间序列预测总结

序列和约束的总结

序列小总结

序列标注任务中的CRFs和LSTMs

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)