论文笔记：A Novel Top-N Recommendation Approach Based on Conditional Variational Auto-Encoder

一、基本信息

论文题目：《A Novel Top-N Recommendation Approach Based on Conditional Variational Auto-Encoder》

发表时间：2019 PAKDD

论文作者：

论文地址：

二、摘要

个性化推荐以其商业价值不断受到关注。最近，变分自动编码器因其在深度协同过滤中的作用而被用于Top-N推荐。基于模型的协同过滤的主要挑战是开发有效的潜在因素表示和用户项目交互记录。本文提出了一类新的条件变分自动编码器（CVAES），它利用了相似用户在购买偏好上倾向于相互关联的事实。这种类型的条件变量自动编码器集中学习标签验证信号，以确保具有相同标签的用户的唯一潜在平均因子。此外，为了处理复杂的多标签组合，我们分别学习不同条件属性的标签，然后合并来自多个预测池的结果，从而使用分割合并框架扩展模型。对两个reallife数据集进行了广泛的实验，以模拟基于用户和基于项目的推荐方案。与现有方法相比，实验结果是有利的。

三、主要内容与工作

1、引入侧信息已被证明是有效的可以改进推荐性能的方法，但关于如何将侧信息融合进模型，目前这方面的研究很少。此外，现实场景中我们往往会有多个标签，随着标签聚集，我们需要处理的维数也在增加，如何将这些标签聚合并提升性能也是一个巨大的挑战。

为了解决第一个问题，我们提出了一个新的CVAE模型用于输出表示学习和标签验证。换句话说，高维输出空间的分布被建模为一个以输入观测为条件的生成部分，而标签验证迫使我们的模型在潜在平均子空间中区分和聚类相似的用户。此外，针对第二个问题，提出了一种分割合并框架，利用CVAE的生成特性和打包思想。我们通过属性来区分条件标签，并训练多个模型。每个子模型从不同的角度理解任务，但所有子模型都能以大致相同的精度生成预测。然后我们从预测池中随机选取结果，并进行合并以进一步改进。

2、本文的贡献主要有三点：

–我们提出了一个新的解决方案，通过引入标签验证来学习CVAE，其中潜在平均因子的投影显示我们的模型成功地为具有相同标签的用户学习了密切表示。
–通过进一步的性能改进，我们展示了我们的分离合并框架在处理复杂条件组合方面的效果。
–我们通过两个现实数据集模拟基于用户和基于项目的建议，并对其进行评估。

3、

4、推荐系统的传统工作集中在明确的反馈和评级预测上。随着个性化推荐技术的发展，研究者逐渐认识到隐式反馈数据和Top-N推荐在实际应用中的重要性[2,15,19]。越来越多的工作[3,20]应用深度神经网络对数据的潜在非线性进行建模，从手工提取特征到直接从原始输入中学习特征。自动编码器是一种用于无监督学习的有效数据表示的神经网络。[17]源于自动编码器在视觉和语音任务中的成功，研究者将其应用于推荐中的协同过滤。后来[19]又将通自动编码器扩展以进行去噪工作，并应用在Top-N任务中，根据结果测量其性能。[21]通过将侧边信息混合在一起的自动编码器框架应用于电影推荐时，显示出对传统方法的显著改进。

变分自动编码器可以看作是自动编码器的一种变体，它对潜在变量的分布作出了强有力的假设。[10–12]是基于可变自动编码器的协同过滤方法，也是我们最相关的研究。[11]考虑多媒体场景中明确评级和内容的影响。在这项工作的启发下，我们注意到变分自动编码器可以在推荐中进行扩展，并且侧边信息可以帮助提高推荐质量。然后[10]提出了多变量协同过滤处理辅助信息的方法。然而，它主要集中在如何通过增广结构来包含变分自动编码器，而不考虑辅助信息可以更优雅地使用。[12]着重于似然函数的选取和正则化超参数整定研究。虽然对于带隐式反馈的Top-N推荐的变分自动编码器的研究是最新的，但它仍然留下了对条件变分自动编码器模型的研究。

四、总结

提出了一种基于多条件标签的扩展变分自动编码器推荐框架。侧边信息被巧妙地融入到条件变量自动编码器中，然后采用分割合并框架进一步提高推荐性能。与简单地堆叠网络层不同，我们利用这些条件标签作为优化目标的一部分，以帮助模型区分和集群潜在子空间中的用户和项目。两个公共数据集的实验结果表明了这种效果。今后，我们将研究联合训练，以减少时间消耗。

论文笔记：A Novel Top-N Recommendation Approach Based on Conditional Variational Auto-Encoder

猜你喜欢