论文笔记:Social Collaborative Filtering Ensemble

一、基本信息

论文题目:《Social Collaborative Filtering Ensemble》

发表时间:PARCAI 2018

论文作者及单位:

论文地址:https://link.springer.com/chapter/10.1007%2F978-3-319-97304-3_77

二、摘要

       协同过滤(CF)技术在生成个性化建议方面发挥着重要作用,但其性能受到数据稀疏和冷启动问题的挑战。另外,不同的CF方法有其自身的优点,因此,另一个难题是如何利用不同方法的互补性。本文提出了一个综合三种常用的CF方法(称为tricf)的通用框架,以进一步提高推荐精度。为了缓解数据稀疏性问题,我们将社会信息嵌入到tricf中,称为sotricf。特别是,利用神经网络模型建立了从社会领域到评级领域的映射,增强了冷启动用户从评级数据中学习到的潜在表征。对三个真实数据集进行的大量实验表明,与最先进的方法相比,所提出的方法取得了显著的改进。

三、论文主要内容与工作

背景

1、不同的推荐算法有不同优点,将它们结合起来有助于提高推荐效果。

2、一些研究表明将社交信息引入推荐对提高推荐效果是有作用的,但由于社交信息的数据稀疏等问题效果很有限。

        在本文中,我们打算通过提出SoTriCF方法来解决上述问题,该方法综合了三种常用的CF方法的优点,以提高推荐的准确性。此外,SoTriCF将用户之间的社交关系编码为低维和紧凑向量,并将其作为辅助信息来增强CF整合,从而共同解决评级数据和社交数据的稀疏性。具体而言,我们设计了一种基于神经网络模型的潜在表征映射方法,该方法可以增强冷启动用户利用其社会潜在表征从评级数据中学习到的潜在表征。对三个数据集的实验分析表明,我们的SoTriCF方法优于其他最先进的方法。

相关的工作

1、协同过滤(CF)是推荐系统中广泛使用的一系列算法。基于邻域的方法和潜在因素模型可以根据评级数据的处理方式而有所不同。基于邻域的方法使用某种相似性度量来选择与活动用户(或目标项目)相似的用户(或项目)。然后,根据这些邻居的评级计算预测值。根据寻找邻居的过程是否集中在相似的用户[21]或项目[23]上,可以进一步分为基于用户和项目。潜在因素模型旨在对用户项目评分矩阵进行因子分解,并使用因子化的用户特定和项目特定矩阵进行进一步的缺失数据预测[11,12,18,19]。不同的CF方法有其自身的优点,适用于不同的场景,因此很自然地将它们组合在一起以获得更好的预测性能。Koren[11]提出了一种结合潜在因素模型和基于项目的CF的集成模型,但是这种模型非常消耗内存。本文试图通过更有效的统一公式,将三种广泛使用的CF方法,即基于用户的CF、基于项目的CF和矩阵分解(MF)综合起来。

2、近年来,由于社会关系在推荐系统中的潜在价值,社会推荐受到越来越多的关注。现有的社会推荐方法大致可分为三类[25],即正则化方法、集合方法和共因子分解方法。正则化方法关注的是用户的偏好,应该类似于他们的社交朋友[10,17]。集成方法的基本思想是,对给定用户的预测评级是用户及其社交网络的评级组合[15]。在共因子分解方法中,基本假设是用户在评级空间和社会空间中应该共享相同的用户偏好[8]。然而,与评级数据相似,社会数据也非常稀疏,这是本文所面临的挑战之一。

3、此外,我们的方法还涉及到图形嵌入技术,它将复杂的社会关系嵌入到低维向量空间中。这种低维表示比传统的图表示更为密集,因此图嵌入是缓解社会网络稀疏性的一种潜在解决方案。现有的图形嵌入方法大致可分为三类:基于因子分解的方法[3,22]、基于随机游走的方法[5,20]和基于深度学习的方法[26]。关于图形嵌入的全面审查,请参考[4]。最近,张等人[30]首先根据从用户项目评分矩阵中计算出的效率提取一个隐式社交网络,然后通过图形嵌入将此类社交信息纳入矩阵分解。然而,一项早期的实证研究[14]表明,为了提高推荐的准确性,显性社会关系比从评级数据推断的隐性社会关系更有效。因此[30]所做的改进是有限的。不同的是,我们试图通过嵌入图来利用明确的社会关系来增强CF集成,以共同解决评级数据和社会数据的稀疏性。

SoTriCF方法的提出

        在本节中,我们将详细介绍我们的Sotricf方法,其框架如图1所示。它由三个主要模块组成。第一个模块是一个潜在的因素模型,它将三种常用的CF方法的优点结合到一个统一的公式中,并根据评级数据和社会数据进行学习。第二个模块是一个图嵌入模型,它将社会网络嵌入到一个低维向量空间中,以减轻社会数据的稀疏性。最后一个是多层感知器(MLP)模型,即建立一个从用户社会潜在表征到评级潜在表征的非线性映射(详见第节)。3.4)。通过这种映射,从评级数据中识别出的冷启动用户可以通过其社交信息得到增强。

原有的BIAS MF

加入smoothness terms后的TriCF

加入社会信息后的SoTriCF

对于社交网络,我们可以根据网络结构计算S^{N},正如链接预测研究[13]中所做的那样。然而,社会数据也非常稀少。为此,我们提出使用图嵌入技术,将社会网络嵌入到低维、紧凑的向量空间中。在这种空间中,每个用户节点都由一个低维向量表示,从而在一定程度上缓解了稀疏性问题。

其中,σ是一个可通过局部标度技术调整的标度参数,其效果已通过频谱聚类[29]和流形排名[28]验证。
如前所述,冷启动用户的问题是CF技术面临的挑战之一,需要提高冷启动用户的体验,因为他们对项目的评价很少。因此,我们将在下一小节中研究使用社会信号丰富冷启动用户的解决方案。

采用MLP建立从社交关系到评分矩阵的映射来解决冷启动问题

实验部分

四、总结

        在这项工作中,我们提出了一种Sotricf方法,将三种常用的CF方法整合到一个统一的学习公式中。为了更好地处理评级数据和社会数据固有的稀疏性,我们利用图嵌入的方法来挖掘CF集成中的社会信息。为了缓解冷启动问题,我们还开发了一种基于神经网络模型的社会域和评级域潜在表示映射的解决方案,它可以增强冷启动用户利用其社会信息从评级数据中学习到的潜在表示。实验研究证实了所提出的方法与最先进的方法相比的优越性。
        在未来,我们将通过合并更多的侧边信息来扩展我们的Sotricf方法,以进一步提高其预测性能。此外,受不断发展的图形挖掘技术[27]的启发,这项工作的另一个扩展是开发Sotricf的在线版本,以考虑社会数据流。

猜你喜欢

转载自blog.csdn.net/qq_35771020/article/details/87883953