推荐系统实践-阅读笔记5

#三.冷启动问题
1.简介
2.利用用户注册信息
3.选择合适的物品 (用户注册后让其自主选择类别)
选择区分度大的物品 P105 评价区分度
4.利用物品的内容信息
5.发挥专家作用

#四.利用用户标签数据
UGC标签 user generated content
1.用户如何打标签
e.g. 给定若干类型,时间,人物,地点,语言…
2.基于标签的推荐系统
e.g. 三元组信息(U,i,label)
基本算法: P124
1.用到TF-IDF的思想 惩罚热门物品
2.标签扩展(标签之间的相似性)

#五.利用上下文信息
1.时间上下文的Item-CF算法 P148
加重用户近期的行为权重 => 衰减函数
2.地点
基于位置的推荐算法
(了解好时间上下文的算法)
3.时段图
(没细看)

#六.利用社交网络获取数据
基于图的推荐
(没细看)

#七.推荐系统搭建实例
1.系统架构
多个推荐引擎组,每一个引擎负责一类特征和一种任务。推荐系统再按照一定的权重和优先级合并,排序
P189 流程图
1.从数据库或缓存中拿到用户的行为数据,通过分析不同的行为,生成当前用户的特征向量
2.将用户的特征向量通过特征-物品相关矩阵转化为初始推荐列表
3.对初始的推荐列表进行过滤 排名处理

1.如何生成用户特征向量? P189
2.特征物品推荐
在得到用户的特征向量后,再依据离线相关表(feature_id, item_id, weight). 注意候选物品集合概念
3.过滤模块
4.排名模块 + click model
==》 用户反馈:
推荐系统的点击率预测(clik model)
点击模型离线已经计算完毕,加载到内存中即可(一般使用线性模型)

#八.评分预测问题
1.三种主要的相似度
余弦相似度,皮尔逊系数,修正的余弦相似度(向量归一化后再计算余弦相似度)
2.LFM
迭代优化参数P Q,这两个矩阵根据RMSE来优化
问题背景:
用户的评分行为表示成评分矩阵R,R[u][i]是用户u对于物品i的评分(非常稀疏)
3.加入时间信息

模型融合:
级联融合 , 加权融合

#后记
我挑了几个我感觉有点道理的
1.正确的用户数据
2.可以直接利用社会网络数据来避免计算兴趣相似的用户

猜你喜欢

转载自blog.csdn.net/u014297722/article/details/87923776
今日推荐