文献阅读 BPR: Bayesian Personalized Ranking from Implicit Feedback - 代码天地

文献阅读 BPR: Bayesian Personalized Ranking from Implicit Feedback

其他 2018-12-17 01:17:59 阅读次数: 0

论文介绍

这篇论文被UAI 2009收录，这篇论文在推荐系统领域中非常经典，就算十年后的今天仍然能在不少论文中看到BPR的身影。

简介和相关工作

推荐系统的任务是给用户推荐一系列个性化的物品，之前人们从显式反馈中做推荐的主要方法为矩阵分解（MF）和适应性K最近邻（KNN）。但是这些方法都不是对物品排名做直接的优化。于是这篇文章提出了一种个性化排名的方法BPR-OPT，这种方法是基于贝叶斯理论的极大化后验概率。用户的显式反馈一般从用户与系统的交互行为中得出，比如用户的购买历史，观看历史等，这些很容易从后台日志中得到。

论文核心

U:表示用户集合
I:表示项目集合
那么
$S\subseteq U \times I\displaystyle$
表示所有的显式反馈，如图所示：
在这里插入图片描述
本文定义了一种偏序关系>u,并且这种偏序关系具有三种特征：完整性，反对称性，传递性。这样可以根据上图的用户物品显性反馈矩阵，得到所有用户的偏序矩阵。如下图所示：

其中，？表示无显性打分数据，+表示用户比j偏爱i，-则相反。
如果用户对查看了物品i2，但是没有查看项目i1，那么可以确定用户对于i1，更偏爱i2。但是如果用户同时查看了i1和i2或者同时都没有查看，那么就是无法确定是否i1和i2的偏序关系。该篇论文的训练集为Ds:
在这里插入图片描述 Ds是一个三元组（u,x,j）的集合。下面我们看看BPR-Optimization Criterion的推导公式：

$\Theta$ 表示用户矩阵或者物品矩阵向量

此处 $\delta$ 是指示函数，当b为真的时候取1否则取0。

此处的激活函数为sigmoid
BPR-OPT的推导过程如下：
在这里插入图片描述

$p(\Theta )$ 满足：
在这里插入图片描述
对
$\Theta$ 求偏导，有如下的训练过程：

最后结合KNN和MF求出最终的物品排名

猜你喜欢

转载自blog.csdn.net/ch_609583349/article/details/84863540

文献阅读 BPR: Bayesian Personalized Ranking from Implicit Feedback

论文1—BPR: Bayesian Personalized Ranking from Implicit Feedback（基于隐式反馈的贝叶斯个性化排名）

VBPR: Visual Bayesian Personalized Ranking from Implicit Feedback

BPR [Bayesian Personalized Ranking] 算法详解

BPR [Bayesian Personalized Ranking] 算法详解及应用实践

Bayesian Personalized Ranking（BPR个性化排序）

Bayesian Personalized Ranking 算法解析及Python实现

implicit feedback

【论文阅读】Collaborative Filtering for Implicit Feedback Datasets

【论文阅读】Learing to summarize from human feedback

论文阅读-Training a Helpful and Harmless Assistant withReinforcement Learning from Human Feedback

论文笔记：Collaborative Filtering for Implicit Feedback Datasets

Graph-Refined Convolutional Network for Multimedia Recommendation with Implicit Feedback

《RankIQA：learning from Ranking for No-reference Image Quality Assment》论文阅读

文献阅读 - From Word Embeddings To Document Distances

论文阅读：LipSync3D: Data-Efficient Learning of Personalized 3D Talking Faces from Video using Pose and L

training a helpful and harmless assistant with refinforcement learning from human feedback

【LLM】RLHF机制（Reinforcement Learning from Human Feedback）

AlpacaFarm: A Simulation Framework for Methods that Learn from Human Feedback

LLM-202212-Claude：《Constitutional AI: Harmlessness from AI Feedback》

Bayesian Compression for Deep Learning 阅读笔记

Personalized Federated Learning using Hypernetworks 论文阅读笔记+代码解读

Deep Leakage From Gradients文献阅读及代码重现

RLHF：基于人类反馈（Human Feedback）对语言模型进行强化学习【Reinforcement Learning from Human Feedback】

BPR实验

[论文解析] Anti-DreamBooth: Protecting users from personalized text-to-image synthesis

【阅读笔记】Ranking Relevance in Yahoo Search

LLMs: 强化学习从人类反馈中学习Reinforcement learning from human feedback (RLHF)

论文阅读 | Persuasion for Good: Towards a Personalized Persuasive Dialogue System for Social Good

Adaptive User Modeling with Long and Short-Term Preferences for Personalized Recommendation阅读

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)