论文浅尝 | 基于迭代的概率规则约束的知识图谱分布式表示

640?wx_fmt=png&wxfrom=5&wx_lazy=1

Citation:Shu Guo, Quan Wang, Lihong Wang, Bin Wang, Li Guo.Knowledge Graph Embeddingwith Iterative Guidance from Soft Rules. AAAI 2018.

动机

知识图谱的分布式表示旨在将知识图谱中的实体和关系表示到连续的向量空间中，本文考虑的问题是如何将知识库的分布式表示和逻辑规则结合起来，并提出了一个新的表示学习方法 RUGE(Rule-Guided Embedding)。

贡献

（1）本文提出了一种新的知识图谱表示学习方法 RUGE，RUGE 在向量表示(embeddings)的学习过程中迭代地而非一次性地加入了逻辑规则的约束。

（2）本文使用的是已有算法自动挖掘的规则，RUGE 的有效性证明了算法自动挖掘的规则的有效性。

（3）本文提出的方法 RUGE 具有很好的通用型，对于不同的逻辑规则和不同置信度的规则的鲁棒性较好。

方法 RUGE

1. RUGE 方法的输入有三个部分：

1) 已标记的三原组：知识库中已有三元组

2) 未标记的三元组：知识库中不存在的三元组。在这篇论文中未标记的三元组只考虑了能够由逻辑规则推导出的三元组。

3) 概率逻辑规则：本文主要考虑了一阶谓词逻辑规则，每一个逻辑规则都标有一个成立的概率值。实验中使用的概率规则来自于规则自动挖掘系统 AMIE+。

2. 模型核心想法如下：

640?wx_fmt=png

3. 三元组表示

本文采用了 ComplEx 作为基础的知识库分布式表示学习的模型，在ComplEx中，每一个实体和关系都被表示为一个复数向量，一个三元组 (e_i,r_k,e_j) 的得分函数设计如下：

640?wx_fmt=png

其中 Re<x> 表示取 x 实部的值，bar{e}_j 为 e_j 的共轭向量。正确的三元组得分函数值会较高而不正确的三元组得分函数的值会较低。

4. 逻辑规则的表示

本文借鉴了模糊逻辑的核心思想，将规则的真值看作其组成部件真值的组合。例如一个已经实例化的规则 (e_u, e_s,e_v) =(e_u, e_t,e_v) 的真值将由 (e_u, e_s,e_v) 和 (e_u, e_t,e_v) 的真值决定。根据(Guo et al. 2016)的工作，不同逻辑算子的真值计算如下：

640?wx_fmt=png