目录
1 基本介绍
什么是推荐系统
当遇到了信息过载的问题,需要一个人或者工具来帮助你做筛选,给出一些建议供选择,这个工具就是个性化推荐系统。
推荐系统的基本任务是联系用户和物品,解决信息过载的问题
推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品 准确地推荐给需要的用户,帮助用户发现那些他们感兴趣但很难发现的商品。
1.2 分类
1.3 组成
前台的展示页面
推荐结果的标题、缩略图以及其他内容属性 告诉用户给他们推荐的是什么。
推荐结果的平均分 平均分反应了推荐结果的总体质量,也代表了大部分用户对这本书的看法。
用户反馈模块
推荐理由 亚马逊根据用户的历史行为给用户做推荐,因此如果它给你推荐了一本金庸的小说,大都是因为你曾经在亚马逊上对武侠方面的书给过表示喜欢的反馈。
后台的日志系统
推荐算法系统
1.4 应用场景
电子商务 电影和视频网站 个性化音乐网络电台 社交网络 个性化阅读 基于位置的服务 个性化邮件 个性化广告
1.5 推荐系统评测
- 离线实验--预测准确度(评分预测、TopN 推荐、覆盖率、多样性、新颖性(平均热门程度)、惊喜度(历史兴趣不相似,但却满意)、商业目标)
- 用户调查--尽量保证测试用户的分布和真实用户的分布相同(信任度)
- 在线实验--AB测试 (切分流量是AB测试中的关键):用户满意度 (购买率、点击率、用户停留时间和转化率)、 实时性、健壮性
2 利用用户行为数据--协同过滤
显性反馈行为包括用户明确表示对物品喜好的行为
具代表性的隐性反馈行为就是页面浏览行为
2.1 用户活跃度和物品流行度的分布
Zipf 定律 :f u ( k ) 为对k个物品产生过行为的用户数,令f i ( k ) 为被k个用户产生过行为的物品数
关系:用户越活跃,越倾向于浏览冷门的物品
2.2 实验设计
评测指标:召回率 准确率 覆盖率(发掘长尾的能力) 新颖度
算法:
- 基于用户的协同过滤算法 ------给用户推荐和他兴趣相似的其他用户喜欢的物品。
(1) 找到和目标用户兴趣相似的用户集。(Jaccard 公式、余弦相似度(倒排表))--需修正
(2) 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
- 基于物品的协同过滤算法 ------给用户推荐和他之前喜欢的物品相似的物品。
(1) 计算物品之间的相似度。(余弦相似度(归一化)(倒排表))--需修正
(2) 根据物品的相似度和用户的历史行为给用户生成推荐列表
- LFM-----通过隐含特征联系用户兴趣和物品
采取基于用户行为统计的自动聚类
- 隐特征的个数 F ;
- 学习速率 alpha ;
- 正则化参数 lambda ;
- 负样本/正样本比例 ratio
- 基于图的模型-----基于随机游走的PersonalRank
3 冷启动问题
4 利用用户标签数据
标签是一种无层次化结构的、用来描述信息的关键词,它可以用来描述物品的语义
- 作者或者专家给物品打标签
- UGC--鼻祖Delicious、论文书签网站CiteULike、音乐网站Last.fm、视频网站Hulu、书和电影评论网站豆瓣等
4.1 标签系统的作用
4.2 问题
5 上下文信息
如何将时间信息和地点信息建模到推荐算法中,从而让推荐系统能够准确预测用户在某个特定时刻及特定地点的兴趣?
6 利用社交网络数据
另外一种个性化推荐:
对推荐结果的反馈方式列表,是按照用户在Facebook的好友关系,给用户推荐他们的好友在亚马逊上喜欢的物品。基于好友的个性化推荐界面同样由物品标题、缩略图、物品平均分和推荐理由组成。不过这里的推荐理由换成了喜欢过相关物品的用户好友的头像。
相关推荐列表--打包销售
浏览过此商品的用户经常购买的其他商品