Adversarial training for multi-context joint entity and relation extraction

Abstract

对抗训练是一种正则化方法，通过对模型的输入增加微小而持久的扰动从而提高模型的鲁棒性。本文将对抗训练应用到实体识别和关系抽取的联合实验当中去，取得了跨语言、多数据集的先进结果。

Model

Joint learning as head selection

对于baseline模型的详细介绍我们可以参考这篇论文（An attentive neural architecture for joint segmentation and parsing and its application to real estate ads）。该模型的两个主要任务为：

（1）识别出实体的类型和边界。

（2）抽取出实体之间的关系类型。

对于该模型的一个输入序列 W =w1, ..., wn。用基于字符的词嵌入技术和基于单词的词嵌入技术将输入token向量化表示，然后使用双向lstm网络去抽取其序列化信息。

NER task：对于实体识别任务，论文中应用(Beginning, Inside, Outside)模式去encoding。对于预测实体标签：

（1）使用softmax算法对实体进行分类（假设实体边界已经知道）。

（2）或者使用CRF识别实体的类型和边界。

如图所示，实体的类型标签会被label embedding 以供关系预测时使用，论文中认为实体类型标签信息对关系预测任务是肯定有所增益的，其joint模式也是以此来体现的。（但是如果实体类型预测的不对，对于关系抽取任务的影响也自然是负面的，其也会导致错误传播。）

Relation Extraction task：作为一个multi-label head selection 问题，句子中的每个单词可以被包含在多种关系当中去。例如图中的“smith”和“California”表达的是“Lives in”关系，同时其也可以表示其他的关系类型（例如：Works for，Born in）。模型的任务是对于s(wj, wi, rk)，根据单词wj去预测它和wi之间的关系rk。