Inf2vec: Latent Representation Model for Social Influence Embedding

2018 IEEE 34th International Conference on Data Engineering

1. 前言

感觉这篇文章和自己之前做的研究方向挺相似的，所以这里想更加细致的看看这个工作，看有什么不同。且有什么值得注意和改进的。

所以，看这篇论文的目标是：

完全理解这篇文章在做什么；
理清楚和自己之前做的工作有什么本质上或者表面上的区别；
代码复现；
实验复现；

虽然前几天也在看这个论文，但是因为前几天比较感兴趣做项目，所以也就只看了摘要部分。这几天自己想集中精力把上面的四个任务点给完成。

时间：2021年11月13日 18:39:22

2. 阅读笔记

文献2提出了EM算法在IC模型下来推断用户u到v的传播概率；
文献3使用共现次数来评估传播概率；
文献5提出了主题认知的影响分析；
文献21提出了一个置信分布模型，可以根据以前的传播中直接的学习到Top k影响力用户；
这些所有的工作都在分析学习影响参数，并且以前的工作都没有考虑到用户兴趣相似度。最关键的是由于网络的稀疏性，这些现有的方法并不能有效的学习到网络中的影响参数。

为了描述本论文的工作和传统的工作的差别，在论文中作者使用了一个图来进行说明：
在这里插入图片描述
传统的方法来建模社交网络中的影响学习问题，通过学习每个边的传播概率来实现。也就是上图左边的依次评估网络中边的传播概率问题。
作者认为整个网络可以使用上图右边的嵌入矩阵来表示，两个用户之间的传播关系可以建模为两个向量之间的相似度来刻画；
因为注意到传播是有方向的，为了反应这种社交影响的方向性，每个用户都具有两个向量，即图中的S和T：

S, 即Source representation。表示该用户影响他人的能力；
T, 即Target representation。表示该用户被其他用户影响的趋势；

可以使用Embedding来替代传播过程，主要是因为作者的主要观点为：

节点在低维空间中被表示为向量，因此这些向量可以反映社交影响信息。

与现有的估计边概率的影响学习工作相比 [2]、[3]、[10]，我们对社会影响嵌入问题的解决方案旨在通过有效捕获用户之间的影响关系并处理数据稀疏性问题。

为了得到最终的嵌入表示，论文中工作大致两个步骤出发：

generate the social influence context;即采用和DeepWalk、node2vec等类似的方式来处理；
通过上下文来学习最终的表示；

因为在之前的影响力模型中没有工作做过用户兴趣，所以在本文中作者尝试将用户兴趣相似性刻画进传播影响模型中。

2.1 局部用户相似性上下文（Global User Similarity Context）

作者认为仅仅是first-order neighbors不足以描述图中的局部影响力，因为比如说u1影响到u2，而u2影响到u3，那么就可以说u1对u3可能具有非直接影响力。
所以，作者认为需要考虑high-order influence propagation。因为在论文中作者首先在数据集中抽取社交网络影响pairs，所以可以根据这种链接关系进一步得到二阶、三阶等关系。

在论文中作者定义了一个影响传播网络(Influence Propagation Network)，比如下面的案例：

在这里插入图片描述