论文笔记:Local Latent Space Models for Top-N Recommendation

一、基本信息

论文题目:《Local Latent Space Models for Top-N Recommendation》

发表时间:KDD 2018

论文作者及单位:

Evangelia Christakopoulou University of Minnesota, Minneapolis, MN, USA
George Karypis University of Minnesota, Minneapolis, MN, USA

论文地址:https://dl.acm.org/citation.cfm?id=3220112

二、摘要

用户的行为是由他们对商品的各个方面的偏好驱动的,这些偏好决定了用户会购买活着查看浏览商品。潜在空间方法以潜在因素的形式对这些方面进行建模。尽管这些方法已被证明能够产生良好的效果,但对不同用户来说重要的方面可能会有所不同。在许多领域中,可能存在一组所有用户都关心的方面,以及一组特定于不同用户子集的方面。为了明确地捕获这一点,我们考虑这样一个模型,模型中的一些潜在因素专门用来捕获共享的方面,而另一些用户子集的特定潜在因素用来捕获不同的用户子集关心的特定的方面。
特别地,我们提出了两个潜在空间模型:rglsvd和sglsvd,它们结合了这样一个全局和用户子集特定的潜在因素集。rglsvd模型根据用户的评级模式将用户分配到不同的子集,然后估计一个全局和一组特定于用户子集的本地模型,这些模型的潜在维度数量可能会有所不同。
sglsvd模型通过保持这些模型中潜在维度的数量相同来估计全局和用户子集特定的局部模型,但优化用户分组以实现最佳近似。我们对各种现实数据集的实验表明,所提出的方法明显优于最先进的潜在空间Top-N推荐方法。

三、论文主要内容与工作

Top-N推荐系统通过利用来自该用户和其他用户的历史信息,在这些项目的大量集合中识别出少量的n个项目,用户会发现这些项目很容易引起他们发生购买、查看、喜欢、单击等行为。它们广受欢迎,从Netflix电影推荐,到亚马逊产品推荐,再到Facebook好友推荐等等。

为解决Top-N推荐任务而开发的方法大致分为两类:基于邻域的(关注用户或项目)和潜在空间的。潜空间方法将用户项矩阵的低阶因子分解为用户和项因子矩阵,这两个矩阵都表示公共潜空间中的用户和项。基于邻域的方法(基于用户或基于项目)侧重于根据评分矩阵识别类似的用户/项目。

item-item方法可能会遭受低效率的个性化;另一方面,潜在空间方法不会面临这个问题,因为等级的增加会导致对每个用户进行更多的潜在特征估计。然而,他们假设用户的行为基于一组由所有人共享的方面,他们通过估计一组共享的潜在因素来建模。我们相信这个用户模型是有限的。相反,我们认为用户根据“所有人共享的某些方面(即全局方面)”和“由类似用户子集(即本地方面)共享的一些更具体的方面”来确定自己的偏好。例如,一个年轻女孩在购买一件衣服时可以根据一些一般的方面,例如这件衣服是否处于良好的状态,以及一些更具体的方面,例如这件衣服是否适合她这个年龄的女孩。因此,这种偏好模型既包含全局元素,也包含局部元素。

在本文中,我们建议通过估计全局低阶模型和多用户子集特定的低阶模型来显式编码这种结构。我们提出了两种方法:变秩的全局和局部奇异值分解(rglsvd)和变子集的全局和局部奇异值分解(sglsvd)。rglsvd方法考虑混合的用户子集,但允许不同的本地模型具有不同的列组。sglsvd方法解决了一个联合优化问题,即估计固定列的局部模型,同时自动阻止挖掘用户的各种子集。这两种方法探索了不同的方法来学习本地的低级表示,从而为用户获得最佳的Top-N推荐质量。用一个全局潜在的模型来估计这样的结构可能是困难的,因为手头的数据通常非常稀疏。

我们在各种真实数据集上评估了我们的方法,结果表明,我们提出的方法具有相似的性能,并且它们的性能优于竞争对手的Top-N潜在空间方法,平均为13%。此外,将sglsvd与项目项方法glslim进行比较,glslim方法也估计了一个全局和多个局部模型,结果表明,尽管glslim获得了更好的Top-N推荐结果,但sglsvd比基线全局方法puresvd快一个数量级,并且sglsvd方法其相对于基线全局方法puresvd的改进百分比高于glslim对slim的改进百分比。

论文的内容组织如下。第2节介绍了使用的符号。第三节介绍一些已有的相关的研究。第4节介绍了本文提出的方法:rglsvd和sglsvd。第5节展示了实验过程。第6节给出了实验结果。最后,第7节结束了这项工作,并提供了一些未来的方向。

四、总结与将来可以做的工作

在本文中,我们提出了以下用户模型:用户的行为可以由所有用户共享的一组方面和一组特定于用户所属子集的方面的组合来描述。这个用户模型是潜空间方法通常使用的模型的扩展,原模型假定用户的行为可以由所有人共享的一组方面来描述。
用全局潜在空间方法来学习我们提出的用户模型是困难的,因为我们经常有稀疏的数据。因此,我们提出了两种方法:rglsvd和sglsvd,通过估计一组全局因子和一组用户子集特定的潜在因子来显式编码这种结构。
实验结果表明,该方法对用户的潜在表征有较好的估计能力,明显优于竞争性潜在空间的Top-N推荐方法,显示了该用户模型的优点。性能改进平均为13%,最高可达37%。
在未来,我们计划结合这两种方法,创建一个“rsglsvd”方法,使用一个规则化的潜在空间模型作为基础模型(如规则化的svd),这样用户就不会总是切换到更高维度的子集,因为这会受到惩罚。另一个潜在的未来方向是估计项目子集,而不是用户子集,这样项目的潜在因子表示也可以得到改进。最后,所提出的方法可以扩展到多个层次的局部模型,而不是本文所示的局部模型,从而形成一个层次模型。

猜你喜欢

转载自blog.csdn.net/qq_35771020/article/details/87770438
今日推荐