关于Network embedding的一些笔记(内含数据集)

首先这也是我进入一个全新领域的第一步,本文有描述不准确的地方还望指正。

Network embedding也就是将Graph中的node投影到低维度的向量空间中,再进行后续处理的计算。A Survey on Network Embedding 这篇论文对各种方法的优点和缺点都进行了详细的叙述。

很多复杂的系统都是采用网络的形式,比如社交网络,生物网络,和信息网络。通常这些网络都很复杂,不容易处理,计算和分析,所以我们就需要一种方法来将这些原本复杂的网络变得简单化,这样我们处理起来会方便很多。通常我们会使用图来进行表示,但是对于大型网络,显然用图会非常的吃力。并且大型网络具有以下的缺点:

1.很高的计算复杂度

2.低的平行型

3.无法应用时下热门的机器学习算法

为了应对这一困难与挑战,很多人已经在努力研发新的 Network embedding methods. 在 Network embedding space中,节点之间的关系由点之间的距离来表示,结构上的特点由向量来表示。比如:(来自论文A Survey on Network)


一、Network Embedding的两个目标:

 1.能够从已经学习到的Emedding space中重新构造出原始的Network

 2.学习到的Embedding space能够有效地支持网络推理(预测未标出连接,识别重要节点,推断节点标签)

二、根据Embedding中保留的信息类型来划分Embedding methods

根据此处的标准我们能够将Embedding methods分为三类

1.network structure and properties preserving network embedding

很多网络分析是可以在原始网络结构上进行的,但是会引起很多的问题,因此我们不禁会去考虑,是否可以只根据网络拓扑信息 来做Embedding,这样很多的分析任务就可以有效地在低维空间去进行。

结构信息包括邻近结构,高阶临近节点,社区结构。

Network Properties包括 network transitivity,structural balance property.

2.network embedding with side information

除了网络拓扑,一些类型的网络有很丰富的Side information,比如节点内容和标签

3.advanced information preserving network embedding

以上两种方法大部分都是在无监督的情况下进行学习的,但是在这里,我们在目标场景应用应用监督学习或者半监督学习。

总的来说,Network structures和properties是基本考虑因素,Side info 和 Advanced info能够使得Embedding在真实场景上表现地更好

三、常用模型

为了达成从Original Space到Embedding Space的映射,这里有几种常用的模型。

1.Matrix Factorization

2.Random Walk

3.Deep Neural Networks(我的最爱哈哈哈哈哈~)

四、三种类别的方法记录

1.Structure and Property Preserving Network Embedding

Deep Walk(Skip Gram)

Node2Vec

LINE

Modularized Nonnegative Matrix Factorization

SDNE

HOPE

2.network embedding with side information

MMDW

RTM

TADW

CNN Model and FC layers

3.advanced information preserving network embedding

Random Walk + GRU(Gated Recurrent Unit, actually a kind of RNN)

五 数据集

Social Network

BLOGCATALOG http://socialcomputing.asu.edu/datasets/BlogCatalog3

FLICKR http://socialcomputing.asu.edu/datasets/Flickr

YOUTUBE http://socialcomputing.asu.edu/datasets/YouTube2

Twitter http://socialcomputing.asu.edu/datasets/Twitter

Citation Networks

DBLP http://arnetminer.org/citation

Cora https://linqs.soe.ucsc.edu/node/236

Citeseer https://linqs.soe.ucsc.edu/node/236

ArXiv http://snap.stanford.edu/data/ca-AstroPh.html

Language Networks

Wikipedia http://www.mattmahoney.net/dc/textdata

Biological Networks

PPI http://konect.uni-koblenz.de/networks/maayan-vidal

猜你喜欢

转载自blog.csdn.net/zhichaoduan/article/details/79570051