【NLP】一种基于联合方式的三元组抽取模型——CasRel

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

  1. 基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。
  2. 联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?,ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

在这里插入图片描述
EPO(Entity Pair Overlap)实体对的重叠&#x

猜你喜欢

转载自blog.csdn.net/meiqi0538/article/details/128887021