传统推荐系统方法理论
文章目录
电影推荐系统原理:
需要数据:电影评分表 电影内容矩阵
基于内容的推荐系统的原理
代价函数
基于矩阵分解的推荐系统的原理
电影评分表 用户喜好矩阵
根据每个用户对于每种电影类型的喜好程度以及用户已经评过分的电影来推荐每部电影的内容,从而预测每个用户对没有看过的电影的评分
最小化代价函数
矩阵分解:分解为电影内容矩阵 用户喜好矩阵
根据喜好,找相似电影 或找相似用户 两种方法
基于商品的协同过滤的推荐系统的原理
商品的相似度
相似函数:
预测用户对商品 评分的预测
基于用户的协同过滤的推荐系统的原理
用户相似度
预测用户对商品的评分
冷启动问题
推荐前提是用户已经存在某些行为,但没有行为记录,成为冷启动问题
1.用户冷启动:随机推荐
2.商品冷启动:推荐新上映电影
如何评估推荐系统的性能以及这些算法的优缺点
1.基于内容:
缺点:
需要透彻的内容分析
很少给用户带来惊喜
2.协同过滤:
优点:
能推断商品质量
不需要对商品有专业知识的认识
缺点:
冷启动问题
复杂度会提升随着商品和用户
同义词影响
会被刷单攻击
混合算法
1.模型混合
2.特征融合
3.不同环境推荐不同结果
4.一个产生结果,一个删选,线性融合
推荐系统评估
线下:学术
RMSE:
REcall 推荐的购买或点击的数量
Precision:推荐的购买或点击的概率
F1 将recall和Precision融合:2x(preXrecall)/(pre+recall)
类似于分类的标准
线上:商业
A/B testing
将推荐系统应用到不同用户分组
CTR
点击率 感兴趣程度
CR
转化率 体验越好
ROI (投资回报-成本)/成本
使用矩阵分解构建电影推荐系统
1.数据收集
数据网站:MovieLens | GroupLens
2.准备数据
电影评分矩阵
用户对电影的评分数据
电影内容矩阵
电影的名字和电影类别数据
用户是否对电影进行评分
4.构建模型
代码连接: