机器学习笔记(十四)推荐系统

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


十四、推荐系统

14.1 例子:电影评分预测

在这里插入图片描述给定这些数据,给定这些 r(i,j)和 y(i,j) 数值,然后浏览全部数据,关注所有没有电影评分的地方,并试图预测这些带问号的地方应该是什么数值,然后向用户推荐新电影。

14.2 基于内容的推荐

对于每一部电影,我们都有一个特征向量来描述它的特征 xi
如下:
在这里插入图片描述由此我们得到对应的优化目标函数:
在这里插入图片描述其中第一个式子是针对单独用户的,第二个式子是对所有用户学习参数 θ的

我们利用梯度下降法来更新参数:
在这里插入图片描述

14.3 协同过滤

上述例子是基于内容的推荐算法,它考虑电影的内容来进行推荐。
但事实上对很多电影我们并没有这些特征,或者说很难得到所有电影的特征,由此我们在这里介绍一种不基于内容的推荐算法(协同过滤)。

我们在这里假设知道每一位用户对于不同类型电影的喜好,然后通过这些喜好来得到对应电影的特征值。

在这里插入图片描述结合上一节所讲的:通过电影i的特征x(i)预测用户j的评分,可以得到最基本的协同过滤算法:
(通过猜测用户的喜好,同时预测电影特征,然后迭代重复学习)
在这里插入图片描述

14.4 协同过滤优化改进

我们可以对上述的算法过程进行优化,通过将这两个优化目标函数何为一个。

在这里插入图片描述具体的步骤如下:
在这里插入图片描述

补充:此时不需要设置x0特征。

14.5 协同过滤向量化

在这里插入图片描述通过向量化后,我们可以很方便的发现相似的电影或者物品。通过比较向量间的距离。
在这里插入图片描述

14.6 均值归一化

当一个用户未曾评分过(cold-start问题),那么如何偏好呢?如果按照以往的话,我们发现Eve对所有电影评分都是0,显然这样结果是不合适的,现在需要解决这个问题。
我们考虑通过以下方式来进行预处理。(均值归一化)
在这里插入图片描述

Guess you like

Origin blog.csdn.net/weixin_43869415/article/details/120178030