论文笔记:A Generic Top-N Recommendation Framework For Trading-off Accuracy, Novelty, and Coverage

一、基本信息

论文题目:《A Generic Top-N Recommendation Framework For Trading-off Accuracy, Novelty, and Coverage》

发表时间:ICDE 2018

论文作者及单位:

Zainab Zolaktaf #1, Reza Babanezhad #2, Rachel Pottinger #3
# Department of Computer Science, University of British Columbia, Vancouver, B.C, Canada

论文地址:https://ieeexplore.ieee.org/document/8509244/authors#authors

二、摘要

       用于Top-N推荐的标准协同过滤方法偏向于一些流行的项目。因为,它们推荐用户可能知道的流行的项目的概率大于不流行的长尾项目的概率。这是不够的,无论是对于喜欢新颖的产品的消费者,还是因为仅关注流行的产品很难覆盖产品空间,而高的产品空间覆盖可以增加供应商的收入。
       本文提出了一种依赖于历史评级数据来了解用户长尾新奇偏好的方法。我们将这些偏好集成到一个通用的重新排序框架中,并对准确性和覆盖率之间进行了平衡。我们从经验上验证了我们提出的框架增加了所推荐物品的新颖性。此外,通过将长尾项推广到正确的用户组,我们显著提高了系统的覆盖率,在具备可伸缩性的同时还保持了准确性。我们的框架还支持对现有的非个性化算法进行个性化,使其在关键性能指标(包括准确性和覆盖率)方面与现有的个性化算法具有竞争力。

三、论文主要内容与工作

       Top-N推荐中的目标是向每个消费者推荐一组来自大量项目集合中的N个项目。例如,Netflix可能希望向每个消费者推荐N部吸引人的电影。协同过滤(CF)是一种常见的Top-N推荐方法。cf通过分析部分观察到的用户项目交互数据(如电影或历史购买日志上的用户评级)来推断用户兴趣。CF中的主要假设是具有相似交互模式的用户具有相似的兴趣。
       Top-N推荐的标准CF方法侧重于提出准确反映用户偏好历史的建议。然而,正如在以前的工作中观察到的,CF建议通常偏向于流行的项目,导致丰富的变得更丰富的效果。其主要原因是CF交互数据的普及偏差和稀疏性。简言之,为了保持准确性,推荐内容是由数据的密集区域生成的,这些密集区域是流行项目所在的区域。
       然而,准确地建议热门商品,可能对消费者不满意。例如,在Netflix中,一位注重准确度的电影推荐人可能会向看过《星球大战:流氓一号》的用户推荐“星球大战:原力觉醒”。但是,这些用户可能已经意识到“力量觉醒”。考虑这些因素,使推荐结果具有新颖性,可以给用户提出更有效的建议。

       关注流行物品也会对物品提供者的满意度产生不利影响。这是因为以准确性为中心的模型通常在其推荐结果中实现较低的总体项目空间覆盖率,而较高的项目空间覆盖率有助于项目提供商增加收入。
       与数量相对较少的受欢迎的项目相比,有大量的长尾项目,可获得的观察结果(如评级)较少。更准确地说,使用帕累托原理(即80/20规则),长尾项可以定义为产生较低20%观测值的项。实验上,我们发现这些项目与几个数据集中的几乎85%的项目相对应。
      如前所示,提高前n个集合的新颖性的一种方法是推荐有趣的长尾项。直觉是,由于这些长尾项的观察结果较少,所以用户更有可能觉得这些长尾项新颖。此外,长尾项目的推广还可使得项目空间的总体覆盖率更高。由于“长尾”促销会降低准确性,因此需要在准确性与新颖性之间进行权衡。
      这项工作研究了Top-N建议的三个方面:准确性、新颖性和项目空间覆盖率,并试验了它们的权衡。在以前的大多数工作中,基础推荐算法的预测被重新排序以处理这些权衡。重新排序模型的计算效率很高,但有两个缺点。首先,由于性能方面的考虑,在新颖性和准确性之间平衡的参数不是为每个用户定制的。相反,它们是在全局级别交叉验证的。这可能是有害的,因为用户对目标有不同的偏好,如长尾新颖性。第二,重新排序方法的结果通常只来源于特定的基础用户,这些基础用户的数据集密度较高。这意味着,重新排序算法对原有数据集进行了修剪,并在密集的环境中研究了该问题,但在现实场景中数据大多是稀疏的。

       我们通过直接从交互数据推断用户对长尾新颖性的偏好来解决第一个限制。仅使用项目受欢迎度统计数据(如参考文献[22]中评级项目的平均受欢迎度)估计这些偏好,而忽略其他信息,例如用户是否发现项目有趣或项目其他用户的长尾偏好。我们提出了一种方法,该方法结合了这些信息,并从交互数据中学习用户的长尾新奇偏好。
      这种方法允许我们定制每个用户的重新排序方法,并设计一个通用的重新排序框架,解决先前工作的第二个限制。特别是,由于长尾新颖性偏好是独立于任何用户进行估计的,因此我们还可以插入一些适当的其他的因素来推断用户的长尾新颖性偏好,例如数据集稀疏性。
     我们的Top-N推荐框架GANC是通用的,在准确性、新颖性和覆盖范围之间提供了一定的平衡。我们的工作不依赖任何额外的上下文数据,尽管这些数据(如果可用)可以帮助促进新增加的长尾项目。总的来说,本文工作与主要内容可以总结为以下几点:

  1. 我们测试了第二节中估算用户长尾新奇偏好的各种已有措施,并制定了一个从交互数据中直接了解用户对长尾项目的偏好的优化问题,。
  2. 我们将用户偏好估计集成到GANC中,并引入基于有序抽样的Lo-Caly贪婪(OSLG)算法,这是一种可扩展的算法,依靠用户的长尾偏好来纠正流行偏好。
  3. 我们进行了广泛的实证研究,并从准确度、新颖性和每个方面的覆盖范围评估效果。在进行实验的过程中我们使用了五个密度和难度不同的数据集。与大多数相关工作相比,我们的评估考虑了现实的设置,包括大量不经常出现的项目和用户。
  4. 我们的实证结果证实了重新排序模型的性能受到底层基础记录和数据集密度的影响。我们的通用方法使我们能够很容易地结合一个合适的基础建议修补器,为密集和稀疏设置设计一个有效的解决方案。在密集的环境中,我们使用与现有重新排名方法相同的基础推荐器,并且在准确性和覆盖率指标方面优于它们。对于稀疏情况,我们插入一个更合适的基础推荐器,并设计一个有效的解决方案,在准确性和新颖性上与现有的顶级推荐方法相竞争。

四、总结与将来可以做的工作

        本文提出了一个通用的Top-N推荐框架,用于权衡准确性、新颖性和覆盖范围。为了实现这一点,我们根据用户对长尾新颖性的偏好对其进行了分析。我们检查各种度量,并制定一个优化问题,从交互数据中学习这些用户偏好。然后,我们将用户偏好估计集成到通用框架GANC中。对多个数据集进行的扩展实验证实,在准确性、覆盖率和新颖性之间存在权衡。几乎所有重新排序的模型都以准确性为代价增加了覆盖率和新颖性。然而,现有的重新排序模型通常依赖于评级预测模型,因此在密集环境中更有效。使用一种通用的方法,我们可以很容易地加入一个合适的基础精度推荐器,为稀疏和密集的设置设计一个有效的解决方案。尽管我们将长尾新颖性偏好估计集成到一个重新排序的框架中,但它们的用例并不局限于这些框架。在未来,我们打算探索长尾新奇偏好的时间和局部动态,尤其是在上下文信息可用的环境中。

猜你喜欢

转载自blog.csdn.net/qq_35771020/article/details/87854554