Machine Learning第九讲【推荐系统】-- (三)低秩矩阵分解

一、Vectorization: Low Rank Matric Factorization(向量化: 低秩矩阵分解)

我们仍然使用之前movie的例子:

将这些数据写成矩阵的形式,即右边的Y矩阵,又因为用户j对电影i的评分预测值为:

因此Y矩阵对应的预测值应为:

                                              


我们记:

                                            

则:

                                        

                                            = 

上述就是协同矩阵的向量化。

那么我们应该怎样来找出相关商品呢?

首先对于每一个产品i,我们找出其特征向量

找出使两个商品特征比较相同的产品,即可以找出使得最小的五个商品,则这5个商品就是和i最相似的5个商品,既可以作为相关产品推荐。

二、Implementational Detail: Mean Normalization(实现细节: 均值归一化)

假设我们有下面一组数据:

即对于某一部电影,利用已经评过分的值(?不计算在内),计算出平均分,记为μ,于是归一化矩阵为原来的Y的每一个数减去这一行(这一部电影)对应的平均值,得到新的Y,如图片右侧所示(?的仍为?),利用这个新的Y矩阵学习θ和x的值。则对于Eve,之前关于最小化的分析仍成立,即

归一化之后的预测值公式为:

因此对于Eve的预测值为:

其实对于这个预测结果我们是可以接受的,因为我们不知道Eve的喜好,因此把她的评分预测为平均水平。

特殊情况:若出现有一部电影无评分的情况,则可以考虑使每列的均值为0,即计算每列的均值,用Y减去对应列的均值得到新的Y矩阵。

猜你喜欢

转载自blog.csdn.net/xueluowutong/article/details/85676076