一、基本信息

论文题目：《Friend Recommendation Considering Preference Coverage in Location-Based Social Networks》

发表时间：PAKDD 2018

论文作者及单位：

论文地址：https://link.springer.com/chapter/10.1007%2F978-3-319-57529-2_8

二、摘要

在基于位置的社交网络中，朋友推荐（friend recommendation）成为一项很有价值的服务。其基本目的是满足人们的社交需求和获取信息的需求。现有的朋友推荐方法大多侧重于用户之间偏好的相似性和共同的朋友，以提高推荐质量。相似的用户可能会有相似的兴趣点偏好（ point-of-interests，POI），他们提供的信息种类有限且冗余，无法覆盖目标用户对POI的所有偏好。本文旨在通过提高FR中用户偏好的信息量，给出“考虑偏好覆盖问题（frpcp）的朋友推荐”定义，这也是一个NP难的问题。本文还提出了一种贪婪算法来解决这一问题。与现有的典型推荐方法相比，我们在大规模的LBSN数据集上验证了推荐的效果，并且显著提高了偏好覆盖率。

三、论文主要内容与工作

随着移动互联网逐渐进入人们的生活、学习和工作。近年来，基于位置的社交网络（lbsns）得到了广泛的应用，如Foursquare、Gowalla、微博、QQ等，与传统社交网络（sns）相比，lbsns的显著优势在于，lbsns可以与物理世界和社交网络中的行为习惯相联系。同时，人们对定位服务的需求也越来越大。其中朋友推荐（fr）已经成为LBSNS中的主要服务应用。基本目标是满足用户的社交需求和获取信息的需求。

目前，现有的工作大多集中在社交需求和提高推荐质量上。过分追求推荐质量会导致忽视用户的信息需求。同时，信息类型单一，而且过于冗余也是现阶段的推荐系统存在的问题。
因此，为了满足用户获取用户偏好信息的需求，避免过多的类型单一和冗余信息，本文考虑了较少的推荐质量。LBSNS和传统社交网络中关于推荐问题的研究的本质区别在于，LBSNS中的推荐算法充分利用了用户的物理行为信息。因为人们在虚拟社会网络中的行为不能真实地反映他们在物理空间中的真实性格偏好和行为习惯。同时，LBSNS还为用户提供了一个社交平台。因此，LBSNS中的朋友推荐问题成为当前亟待解决的问题之一。
传统社交网络上的好友推荐算法从推荐对象上可以分为两类：（1）线下的朋友（真实世界的朋友）；（2）陌生人。传统社交网络中朋友推荐算法从挖掘信息的类型可以分为两类：（1）拓扑信息（如普通朋友）[1]；（2）非拓扑信息（如个人隐私等）。目前，朋友推荐算法主要采用协同过滤[2,3]、随机游走[4]、遗传算法[4]、加权Voronoi图算法[5]。Marketing Letter的社会调查显示：人们获取信息的途径更可能是从自己的朋友那里获得。因此，朋友推荐可以帮助人们获得信息。同时，社交网络中的用户有社交需求（扩大朋友圈）和获取信息需求[6]。现有的朋友推荐算法主要着眼于扩大你的社交圈。然而，用户在LBSN中还可以相互传播和提供信息。传统的朋友推荐方法主要考虑用户偏好、签到行为之间的相似性。但当用户之间的兴趣偏好越相似，用户之间相互获取到的有用信息量越少。因此，传统推荐算法无法解决上述问题。我们的目标是提高用户更喜欢（不是最好）的POI类别的信息量。一般来说，个人偏好的分布服从一个长尾分布[10]。通过实验验证了用户的偏好服从幂律分布，如图1所示，

也就是说，用户对长尾中的POI类别偏好知之甚少。我们在图2中给出了一个朋友推荐的例子。基于偏好相似性，系统只为目标用户推荐潜在的朋友集user1、user2、user3。然而，本推荐结果中的POI偏好类别比较单调，仅涵盖目标用户偏好的TOP1、TOP2、TOP3。黑色虚线框部分未覆盖。相比之下，使用列表user2、user5、user6将是一个比上述列表更好的推荐列表，它可以获得更好的相似性得分，同时为目标用户提供信息的多样性top1、top2、····、top7。因此，基于偏好相似性的对目标用户的建议几乎不能提供有关长尾中这些POI类别的信息。随着推荐结果的增加，来自这些结果的信息变得同质化，所有用户都已经知道了。因此，这些建议不利于信息获取的多样性。

因此，本文同时考虑了上述用户在交友推荐过程中的需求，旨在克服长尾系统中POI类别的局限性。最简单、最直接的方法是向目标用户推荐长尾POI类别的“experts”。由于缺乏偏好相似性分析，“experts”和目标用户成为朋友的可能性较低。马等。[8]提出了基于社交网络拓扑信息的朋友推荐算法，旨在提高用户对社交网络拓扑结构的影响。这种方法可以帮助用户获取和传播更多的信息。然而，它利用网络结构作为推荐的基础，缺乏语义信息。现实生活中的人们在不同的语义主题下拥有不同数量的信息和社会影响。LBSNS记录用户的签到行为（签到信息：纬度和经度；位置名称和类别；签到时间、评论、照片等），这些签到信息可以真实地反映用户的在线行为和个性描述、偏好特征。因此，用户喜欢的POI类别的语义信息可以通过用户在LBSNS上的偏好行为来描述。推荐的用户可以间接地提供目标用户更喜欢或最好的特定POI类别的更多信息。湾等。[9]提供了一种基于传统社交网络工作中的信息效用推荐朋友的推荐方法。但该方法不考虑用户偏好的分布特征，缺乏物理环境下的签到行为分析。每个用户对POI类别的偏好信息分布服从幂律分布，且有很长的拖尾，如图1所示。
大多数朋友推荐方法都推荐目标用户，这些用户在POI首选项上具有很高的相似性。他们的主要目标是提高推荐质量，但推荐质量在召回率和准确率中的作用并不显著，增加幅度仅为1%左右。因此，在用户容忍推荐质量的前提下，丰富用户信息需求，与单纯提高推荐质量相比，具有更大的应用价值。同时考虑了推荐质量和用户信息需求。由于这些推荐用户的POI偏好分布都遵循幂律分布和长尾分布，因此他们和目标用户很少在长尾中查看某些POI类别。我们将这种情况视为用户在长尾中对这些POI类别的信息较少。本文旨在克服朋友推荐的拖尾现象。这些推荐的潜在朋友类似于目标用户对POI类别的偏好，它们可以为目标用户提供更多关于长尾POI类别的信息。关键是这些信息可以完全覆盖目标用户的POI类别偏好。

本文的贡献总结如下：

–问题：我们定义了一个新的朋友推荐问题，考虑到LBSNS中的偏好覆盖。这个问题是一个优化问题。同时，它也是NP难的。
–设计偏好覆盖度量：我们根据香农熵设计了朋友推荐中用于评估偏好覆盖程度的指标。
–性能：本文为优化问题提供了贪婪算法（称为frpc）。
-发现：我们对两个大型真实数据集（Foursquare，Gowalla）进行了全面的实验，实验结果表明，我们的推荐质量算法与两种典型推荐方法的一致性相对较好。就偏好覆盖的程度而言，该方法具有显著的优势。

四、总结与将来可以做的工作

本文关注基于位置的社交网络中考虑偏好覆盖的朋友推荐。首先，我们讨论了用户对POI类别偏好的相似性，并详细描述了偏好覆盖的模型。基于上述模型，本文提出了一个新的朋友推荐问题作为一个优化问题。然后给出了一个贪婪算法frpc-a来解决推荐问题。我们的方法向目标用户推荐能够提供更多有关POI类别首选项信息的用户，并避免在长尾中用户拥有较少的POI类别信息的情况。与现有的LBSNS中典型的朋友推荐方法相比，大规模的LBSNS数据集通过朋友推荐和我们方法的有效性验证了偏好覆盖的程度。特别是，我们的方法显示了在偏好覆盖程度上的显著优势。对于未来的工作，我们计划利用多源信息（如评论信息、签到时间，并建立签到行为周期模型，以提高推荐的效果）。

论文笔记：Friend Recommendation Considering Preference Coverage in Location-Based Social Networks

一、基本信息

二、摘要

三、论文主要内容与工作

四、总结与将来可以做的工作

猜你喜欢