《Conditional Network Embeddings》论文分析

《Conditional Network Embeddings》发表在ICLR2019上

论文解读:

1.论文思路:

考虑到现有嵌入方法所面临的一个困难是,某些网络由于其结构特性:比如(近似)多分性、一定程度的分布性、协调性等,从根本上难以嵌入。为了克服这一问题,本文在网络嵌入领域引入了创新的概念,并提出创建条件网络嵌入(CNEs);最大限度地增加与给定结构属性相关的信息(例如节点度、块密度等)的嵌入。使用简单的贝叶斯方法来实现这一点,并提出了一种块随机梯度下降算法来有效地拟合它。论文证明,与最先进的方法相比,CNEs在链接预测和多标签分类方面更优,而且不增加显著的数学或计算复杂性。最后,论文说明了CNE在网络可视化方面的潜力。

2.论文模型

2.1模型核心

找到一个关于给定网络G信息最丰富的嵌入X,形式化为最大似然(ML)估计问题:

CNEs的创新之处在于,在ML估计中很常见的,没有直接假设似然函数P(G|X)。相反,论文使用一种通用的方法来推导网络P(G)的先验分布,并假设网络P(X|G)条件数据下的密度函数。这使得人们可以通过贝叶斯规则的简单应用将任何关于网络的先验知识引入公式中:P(G|X) = (p(X|G)P(G))/(p(X))。结果是,嵌入将不需要表示任何已经由先验P(G)表示的信息。

2.2模型构建

2.2.1网络的先验分布
希望能够以可管理的网络先验概率分布P(G)的形式为广泛类别的先验信息类型建模。从三种常见的先验信息开始:关于整体网络密度的信息,关于单个节点度的信息,以及关于节点特定子集内或子集之间的边缘密度的信息(例如,对于多部分网络)。每种类型的先验信息都可以表示为对各种子集和的期望的约束集:

则P(G)如下:

此外,这些伯努利成功概率Pij可以有效地表示为有限数量的参数,即对应于先验信息约束的拉格朗日乘子。
2.2.2网络上数据的条件分布


2.2.3嵌入上的网络条件后验

2.3模型求解(寻找最大信息的嵌入)

3.结论

到目前为止,关于NE的文献一直将嵌入式视为独立使用的工具。然而,欧几里德嵌入不能准确地反映某些类型的网络拓扑,因此这种方法不可避免地受到限制。论文提出了条件网络嵌入(CNEs)的概念,它寻求一个网络的嵌入,最大限度地增加与给定的网络先验知识相关的信息。这种先验知识可以编码关于网络的信息,而这些信息无法通过嵌入很好地表示。通过融合数据和网络,论文在一个简单的概率模型的基础上实现了这个概念新颖的想法,其规模类似于最先进的NE方法。该算法的经验评价证实了作者的直觉,结构先验知识和欧式嵌入的结合是非常强大的。这在链路预测和多标签分类任务中都得到了经验的证实,在这些任务中,CNE在大范围的网络中都优于一系列最先进的基线。在未来的工作中,作者打算研究实现条件NEs思想的其他模型,替代的和更可伸缩的优化策略,以及使用其他类型的结构信息作为网络上的先验知识。

猜你喜欢

转载自blog.csdn.net/luoxuexiong/article/details/89710348