推荐系统实践-阅读笔记4

一. 隐语义模型

latent factor model
算法理论
对于某个用户,首先得到他的兴趣分类,再从分类中挑选他可能喜欢的物品
基于用户行为的自动聚类
P83 迭代优化P Q两个参数
(负样本采集问题: 热门商品却没有被用户喜欢的商品作为该用户的负样本)
重要的参数有:
1.隐藏的特征个数F
2.学习速率alpha
3.正则化参数lamba
4.负样本/正样本比例ratio
缺点:
雅虎的首页推荐。很难做到实时推荐,因为需要反复的迭代
e.g. 新闻推荐的冷启动问题非常明显

#二. 基于二分图的模型
一边的节点是用户,一边的节点是物品。连接边代表两者之间有联系
相关性评价指标:
1.两个顶点之间很多路径相连
2.两个顶点之间的路径长度比较短
3.两个顶点之间的路径不经过出度比较大的顶点 (避开用户活跃度高 或者 热门的商品)
随机游走的personalRank
P92
==> 矩阵形式的PersonalRank
P94

猜你喜欢

转载自blog.csdn.net/u014297722/article/details/87923764
今日推荐