论文笔记：Collaborative Filtering for Implicit Feedback Datasets

一、基本信息

论文题目：《Collaborative Filtering for Implicit Feedback Datasets》

发表时间：ICDM 2008

作者及单位：

论文地址：https://dl.acm.org/citation.cfm?id=1510528.1511352

二、摘要

推荐系统的一个共同任务是通过基于事先隐含反馈的个性化推荐来改善客户体验。这些系统被动地跟踪不同类型的用户行为，例如购买历史记录、观看习惯和浏览活动，以模拟用户偏好。与被更广泛研究的明确反馈不同，我们没有用户关于他们偏好的任何直接输入。特别是，我们缺乏消费者不喜欢哪些产品的充分证据。在这项工作中，我们确定了隐式反馈数据集的独特的适当联系。我们建议将这些数据视为积极和消极偏好的迹象，这些偏好与显著变化的信心水平有关。这导致了一个因素模型，特别是针对隐含反馈推荐。我们还建议一个可扩展的优化过程，它与数据大小成线性关系。该算法在电视节目推荐系统中得到了成功应用。它与其他已知方法的调优实现相比更为有利。此外，我们还提供了一种新的方法来解释这个因素模型给出的建议。

三、主要内容与工作

1、使用隐式反馈的几个特点：

No negative feedback
Implicit feedback is inherently noisy
The numerical value of explicit feedback indicates preference, whereas the numerical value of implicit feedback indicates confidence.
Evaluation of implicit-feedback recommender requires appropriate measures.

2、

四、总结

在这项工作中，我们研究了隐式反馈的数据集协同过滤，这是一种非常常见的情况。我们的一个主要结论是，隐式用户观察应该转化为两个成对的量级：偏好和信心水平。换言之，对于每个用户项对，我们从输入数据中得出一个估计值，以判断用户是否喜欢该项（“首选项”），并将该估计值与置信水平结合起来。在广泛研究的显式反馈数据集中，这种偏好一致性划分没有平行性，但在分析隐式反馈中起着关键作用。
我们提供了一种潜在因素算法，可以直接对偏好信心范式进行广告设计。与显式数据集不同，这里的模型应该将所有用户项首选项作为输入，包括那些与任何输入观察无关的参数（因此暗示为零首选项）。这一点至关重要，因为给定的观察结果固有地偏向于积极的偏好，因此不能很好地反映用户的偏好。但是，将所有用户项值作为模型的输入会引发严重的可伸缩性问题——所有这些对的数量往往明显超过输入大小，因为典型的用户只会对可用项的一小部分提供反馈。我们通过利用模型的代数结构来解决这一问题，从而得到一种算法，该算法在不使用任何子采样的情况下，在处理整个用户项对范围的同时，与输入大小成线性比例。

该算法的一个有趣特点是，它允许向最终用户解释建议，这在潜在因素模型中是罕见的。这是通过在众所周知的面向项目的邻近方法中显示出一种令人惊讶的、希望富有洞察力的联系来实现的。
该算法作为大型电视推荐系统的一部分进行了实现和测试。我们的设计方法力求在隐式反馈数据集的独特属性和计算可伸缩性之间找到一个正确的平衡。我们目前正在探索一种以增加计算复杂性为代价提高精度的可能性。作为一个例子，在我们的模型中，我们决定用相同的一致置信度来处理与零偏好相关的所有用户项对。由于绝大多数对都与零偏好相关，因此该决策节省了大量计算工作。然而，一个更仔细的分析会将这些零值分为不同的置信度级别，可能基于项目的可用性。在我们的电视推荐示例中，用户没有观看节目的事实可能意味着用户不知道该节目（该节目位于“不寻常”频道或一天中的某个时间），或者同时有另一个最喜欢的节目，或者用户只是不感兴趣。每一个都对应不同的场景，并且每一个都可能保证在“无偏好”假设中有一个独特的信心水平。这导致我们对该模型进行了另一种可能的扩展——添加一个动态时间变量，以解决用户在特定时间观看电视的趋势。同样地，我们想模拟一些程序类型在一天中的不同时间更受欢迎。这是一项正在进行的研究的一部分，其中主要的挑战似乎是如何在保持良好的计算可伸缩性的同时，将额外的灵活性引入到模型中。

最后，我们注意到，标准的训练和测试设置旨在评估模型对未来用户行为的预测能力。然而，这并不是推荐系统的目的，推荐系统试图将用户指向他们可能没有购买或消费的商品。在不使用深入的用户研究和调查的情况下，很难看到如何评估该目标。在我们的示例中，我们相信通过评估我们的方法，通过删除重新观看的节目的“简单”案例，我们以某种方式接近尝试捕获用户发现新节目的理想。

论文笔记：Collaborative Filtering for Implicit Feedback Datasets

猜你喜欢