推荐系统实践（三）推荐系统冷启动问题 - 代码天地

推荐系统实践（三）推荐系统冷启动问题

编程语言 2019-02-28 14:21:49 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_20095389/article/details/87811651

一、思维导图

二、用户冷启动

1、利用用户注册信息

算法流程

获取用户的注册信息
根据用户的注册信息对用户分类
给用户推荐他所属分类中用户喜欢的物品

重点 - 计算每种特征用户喜欢的物品

方式一:p(f,i)：有f特征的用户中喜欢物品i的人数

方式二：惩罚热门物品

一般来说，分类粒度越细，精度和覆盖率也会越高

2、选择合适的物品启动用户的兴趣

什么是合适的物品？

比较热门
具有代表性和区分性
启动物品集合需要多样性

如何选择启动物品集合？

基本思想，选择物品区分度大的作为启动物品集合，然后利用决策树将用户兴趣提取出来，再推荐同类型的物品~

算法，其中 $\delta_{u\in N^{+}(i)}$ 是喜欢物品i的用户对其他物品评分的方差， $\delta_{u\in N^{-}(i)}$ 是不喜欢物品i的用户对其他物品评分的方差， $\delta_{u\in \bar{N}(i)}$ 是没有对物品i评分的用户对其他物品评分的方差。

3、两个算法的区别

利用用户注册信息，一般是基本信息，无法知道用户的兴趣，或用户自己也不知道自己兴趣的情况下，因此利用用户的类别和这类别用户喜欢的物品推荐，更具社交属性。
选择合适的物品启动兴趣，主要利用用户对物品的选择，发掘用户的兴趣点，给用户推荐同类别的物品，更具有用户自我的独特个性~

三、物品冷启动

1、利用物品的内容信息

个人感觉这应该是依据具体业务，然后自己制定相应的算法，这边所谓的算法，除了通用的，基本是根据业务自己设定的逻辑条件等，就像传统图像算法一样。

向量空间模型

将文本信息表示成关键向量 $d_{i}=\{(e_{1},w_{1}),(e_{2},w_{2})...\}$ ，其中 $e_{i}$ 是关键词，w_{i}是关键词对应的权重。

权重计算利用TF-IDF理论https://www.cnblogs.com/pinard/p/6693230.html
$w_{i}=\frac{TF(e_{i})}{logDF(e_{i})}$
计算物品相似度
$w_{ij}=\frac{d_{i}*d_{j}}{\sqrt{\left\|d_{i}\right\|\left\|d_{j}\right\|}}$
ItermCF 的思想，给用户推荐和他历史上喜欢的物品相似的物品。

话题模型

解决文本很短，关键词很少情况，物品相似度难以计算的问题。例如：推荐系统的动态特性VS基于时间的协同过滤算法研究。因此需要建立文章，话题，关键词的关系
LDA算法
- 对z初始化，z[i][j]是第i篇文档中第j个词属于的话题
- 迭代使话题的分布收敛到一个合理的分布上去
这篇讲的比较好LDA原理讲解通俗版

2、发挥专家作用

猜你喜欢

转载自blog.csdn.net/qq_20095389/article/details/87811651

推荐系统实践（三）推荐系统冷启动问题

【推荐系统实践】冷启动问题

推荐系统实践(三) -- 冷启动问题

推荐系统实践学习系列（三）推荐系统冷启动问题

推荐系统实践---第三章：推荐系统冷启动问题

《推荐系统实践》第三章推荐系统冷启动问题

推荐系统冷启动问题及解决

推荐系统中冷启动问题

推荐系统实战——冷启动问题

推荐系统冷启动问题

推荐系统之冷启动问题

推荐系统----冷启动问题

推荐系统的评估及冷启动问题

推荐系统冷启动问题（用户冷启动、物品冷启动、系统冷启动）

[推荐系统 04] 推荐系统冷启动问题

推荐系统之冷启动问题推荐系统之冷启动问题

《推荐系统实践》__第3章__推荐系统冷启动问题

推荐系统实践——第3章推荐系统冷启动问题

推荐系统学习 -- 冷启动问题

如何解决推荐系统中的冷启动问题？

推荐系统中的用户冷启动问题

浅谈冷启动问题（推荐系统相关）

读书笔记《推荐系统实战》| 推荐系统冷启动问题

推荐系统Lambda架构介绍（八）：推荐系统的冷启动问题和常用的处理方法

大数据课程K19——Spark的电影推荐案例&&推荐系统的冷启动问题

推荐系统的冷启动

推荐系统冷启动

推荐系统冷启动问题的常见解决方案

推荐系统之冷启动

推荐系统中的冷启动

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)