文献阅读 BPR: Bayesian Personalized Ranking from Implicit Feedback

论文介绍

这篇论文被UAI 2009收录,这篇论文在推荐系统领域中非常经典,就算十年后的今天仍然能在不少论文中看到BPR的身影。

简介和相关工作

推荐系统的任务是给用户推荐一系列个性化的物品,之前人们从显式反馈中做推荐的主要方法为矩阵分解(MF)和适应性K最近邻(KNN)。但是这些方法都不是对物品排名做直接的优化。于是这篇文章提出了一种个性化排名的方法BPR-OPT,这种方法是基于贝叶斯理论的极大化后验概率。用户的显式反馈一般从用户与系统的交互行为中得出,比如用户的购买历史,观看历史等,这些很容易从后台日志中得到。

论文核心

U:表示用户集合
I:表示项目集合
那么

表示所有的显式反馈,如图所示:
在这里插入图片描述
本文定义了一种偏序关系>u,并且这种偏序关系具有三种特征:完整性,反对称性,传递性。这样可以根据上图的用户物品显性反馈矩阵,得到所有用户的偏序矩阵。如下图所示:
在这里插入图片描述
其中,?表示无显性打分数据,+表示用户比j偏爱i,-则相反。
如果用户对查看了物品i2,但是没有查看项目i1,那么可以确定用户对于i1,更偏爱i2。但是如果用户同时查看了i1和i2或者同时都没有查看,那么就是无法确定是否i1和i2的偏序关系。该篇论文的训练集为Ds:
在这里插入图片描述Ds是一个三元组(u,x,j)的集合。下面我们看看BPR-Optimization Criterion的推导公式:
在这里插入图片描述
表示用户矩阵或者物品矩阵向量
在这里插入图片描述
此处是指示函数,当b为真的时候取1否则取0。
在这里插入图片描述
此处的激活函数为sigmoid
BPR-OPT的推导过程如下:
在这里插入图片描述

满足:
在这里插入图片描述

求偏导,有如下的训练过程:
在这里插入图片描述
在这里插入图片描述
最后结合KNN和MF求出最终的物品排名

猜你喜欢

转载自blog.csdn.net/ch_609583349/article/details/84863540
今日推荐