关系抽取和事件抽取的一些任务特色 - 代码天地

关系抽取和事件抽取的一些任务特色

其他 2020-09-18 09:25:56 阅读次数: 0

关系抽取

1. 评测背景：知识是机器语言理解与交互的重要基础

机器语言理解与交互是人工智能的基本挑战，五大任务助力（机器阅读理解、面向推荐的对话、语义解析、关系抽取、事件抽取）
知识是机器语言理解与交互的重要基础
关系抽取是知识获取的重要方式
知识图谱

2. 评测任务：schema约束下的SPO抽取任务

任务描述：

抽取输入句子中所有符合schema约束的SPO三元组
输入：预定义schema& 句子
输出：SPO三元组
任务特色：挑战关系抽取模型较难解决的问题
重叠关系抽取问题
复杂关系抽取问题

3. 评测数据集 DuIE2.0 面向真实业务场景的schema

数据生成

DuIE1.0 根据query log 统计筛选
知识库：百度知识图谱数据
语料：百度百科+百度信息流
候选生成
基础候选：SPO粒度远监督
候选扩召：schema粒度远监督+并列结构pattern
众测标注：
训练集&开发集：单副本判断题标注+单论review
测试集：双副本填空题标注+两轮review
DuIE2.0，48个关系类型，5个复杂关系类型

4. 2019基线系统：基于BI-LSTM的pipeline模型

模型结构

Pipeline结构：先关系分类，在进行s/o 标注
Embedding层：词语，词性，位置
编码层：Bi-LSTM
关系分类输出层：多标签sigmoid
存在问题
Pipeline没有利用关系分类，S/O 标注两个子任务之间的联系，且存在错误传递，效果不易优化
采用Bi-LSTM作为编码器，不易并行处理，训练/预测效率低，且特征抽取效果不如预训练模型
s/o标注子任务采用简单的BIO 标注，不易直接处理复杂关系的问题。

5。2020的基线系统：基于ERNIE的E2E标注模型

一步解决关系重叠关系的抽取问题
BI-LSTM编码器->ERNIE预训练模型
简单BIO标注策略->新型BIO标注策略

事件抽取

事件：在特定时空下（时间，空间），由一个或多个角色（事件主体）主题开展的一系列活动

事件抽取Event Extraction,EE ：

事件要素的结构化抽取，具体的，是从非结构化的自然语言文本中识别事件及其类型，抽取其事件的元素的技术
事件抽取常用Pipeline

1⃣️触发词识别
2⃣️事件类型识别
3⃣️论元抽取
句子：2017年10月31日，宋仲基，宋慧乔在首尔举行婚礼
事件类型：结婚触发词：举行婚礼时间：地点：男主：女主：
研究价值：
更具研究价值，更加复杂的应用场景
应用：信息分发，舆情分析，金融事件分析，对话系统

事件抽取的主流方法：

Pipeline-based （trigger+arg）
Joint-Based (trigger+arg)同时联合出发词和论元，相互验证

事件抽取的评测任务：

任务描述：通过给定目标事件类型和角色类型集合句子，识别句中的目标事件，并根据论元角色集合抽取事件所对应的论元

输入：包含事件信息的一个或多个连续的句子
输出：属于预先定义的事件类型，类型的论元结果
数据集特点：
一个句子包括多触发词
多值论元角色
面向真实应用场景构建
事件schema 定义
65个事件类型+121论元角色
评估方法
F1=（2PR）/（P+R）

Baseline 模型

基于序列标注的触发词抽取模型
基于序列标注论元抽取模型
[1]https://mp.weixin.qq.com/s?__biz=MzUxNzk5MTU3OQ==&mid=100002954&idx=1&sn=6ccf514c3649b58d7bd96eb1de29d1e6&scene=19#wechat_redirect

猜你喜欢

转载自blog.csdn.net/weixin_42462804/article/details/106382467

关系抽取和事件抽取的一些任务特色

NLP关系抽取和事件抽取

【事件图谱】事件抽取与事件关系抽取

2022 ACL 最全事件抽取和关系抽取相关论文

信息抽取——关系抽取(一)

Tribon数据抽取的一些心得

chatgpt实现NLP基本任务（实体识别、关系抽取、属性抽取、事件抽取、文本分类）

关系抽取（一）

知识抽取-实体及关系抽取(一)

知识抽取-事件抽取

关于关键词抽取的一些思考

关系抽取

事件抽取

实体抽取-关系抽取-事件抽取与知识图谱学习资源汇总

徐阿衡 | 知识抽取-实体及关系抽取(一)

关系抽取|自然语言处理中关系抽取任务现有技术分析

联合关系抽取论文（一）——TPLinker

抽取

sqoop抽取数据从oracle到hive的示例以及一些问题的解决方法

NLP-信息抽取-关系抽取-2017：基于神经网络的实体识别和关系抽取联合学习

关系抽取总结

实体关系抽取综述

关系抽取介绍

NER --关系抽取总结

实体识别与关系抽取

pytorch关系抽取实验

关系抽取学习

关系抽取bootstrap

关系抽取snowball

实体关系的抽取详解

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)