论文阅读 | Using Automatically Extracted Minimum Spans to DisentangleCoreference Evaluation from Boundary Detection

论文地址：https://www.aclweb.org/anthology/P19-1408/

作者：Nafise Sadat Moosavi1, Leo Born, Massimo Poesio, Michael Strube

机构： Technische Universitat Darmstadt, Heidelberg University, Queen Mary University of London, Heidelberg Institute for Theoretical Studies gGmbH

研究的问题：

关注的是共指消解问题，也就是找到指向相同实体的不同表达式。一般解决该问题的方法是识别每个指代的最大跨度。为了解决这个问题，在较小的语料库中手工标注最小跨度。但是这个方案的标注成本比较高，本文做的就是提出了一种自动提取最小跨度的算法MINA。

研究方法：

为了解决最大跨度边界检测的复杂性，一些较小的语料库中明确标注了每个指代的最小跨度和最大跨度。传统的算法基于Gold parse tree和system parse tree，它们存在的问题是可能会产生不同的结果。MINA为了减少gold和system两种方法之间的性能差异而提出。

如何决定最小跨度：

从词所对应的解析树（constituency-based parse trees）中提取MINA范围，也就是说MINA范围是词对应的最大跨度的词的子集。对于对应的最大跨度的解析子树，以宽度优先的方式确定最小跨度。下面是算法描述。

其中，根是解析树的根，标记是用于提取最小跨度的可接受语法标记集，最小深度是解析树中最小跨度节点的深度，mini-spans是算法中对应于最小跨度的词集。可接受的终端节点集（acceptable terminal）指除限定词、连接词以外还包含至少一个词的节点集，终端节点不再进一步拆分。具体包括NP（名词短语）、NML（名词修饰语）、QP（包括量词的名词短语）、NX（一些特定的名词短语）和VP（唯一可接受的动词短语）。

在处理的过程中，以宽度优先的方式处理。跳过标记为不可接受的节点为根的子树。对于其余的节点，将所有的到根距离最近的终端节点作为最小跨度。

例子：

评估最小跨度：

评估包括以下两个指标：

（1）使用MINA提取出的最小跨度长度应小于最大跨度。

（2）MINA提取出的最小跨度和专家手动注释的是否一致。

实验结果如下：

这张表中的head也就是人工标注的结果。可以看到MINA总是大于head，可以认为MINA包含了大部分的指代。

作者分析了这种错误来源，主要来自于解析错误。如下面这张图。

在共指关系任务上的实验：

结论：

（1）在跨数据集的评估中，使用最大跨度和最小跨度的评估结果差异比较大，这样因为在最大跨度中边界检测的错误更加明显，会影响评估结果。

（2）MINA在一定程度上减少了gold和system解析树之间的性能差异，也就是分别对两者使用MINA得到的最小跨度在一定程度上抹平了这一点。

（3）由于最大跨度的评估有更多的噪声，基于最小跨度的评估减少了这部分的影响。

评价：

本文提出的MINA，最大的优点在于，不增加额外标注成本的额情况下，基于gold和system解析树提取最小跨度。基于实验结果提出了对于共指关系任务评估的建议和看法。本文的一些分析还是很详细的，针对MINA本身还有共指关系任务上分别作了实验和分析。这个MINA算法在命名实体识别或者其他的一些NLP任务中应该也可以应用。

论文阅读 | Using Automatically Extracted Minimum Spans to DisentangleCoreference Evaluation from Boundary Detection

猜你喜欢