《机器学习:算法原理和编程实践》4:推荐系统原理





2、协同过滤及其算法

     协同过滤通过用户和产品及用户的偏好信息产生推荐的策略,最基本的策略有两种:一种是找到具有类似品位的人所喜欢的物品;另一种是从一个人喜欢的物品中找出类似的物品。这就是两个最知名的类别推荐技术:基于用户的推荐技术和基于物品的推荐技术,它们被称为协同过滤。

     协同过滤可以利用用户和物品的信息来预测用户的好恶,并发现新的用户还不知道的东西,形成促销策略。这就完成了推荐系统的核心思想。

     数据预处理:收集了用户行为数据,我们还需要对数据进行一定的预处理,减燥和归一化是最常用的方法,其目的是为了下一步的聚类。

      为了减少计算的开销,可以先对UI矩阵中的记录进行聚类,根据聚类的结构在运用SVD算法。

      KMeans(也称为K均值)是典型的基于距离的排他的划分方法:给定一个n个对象的数据集,它可以构建数据的k个划分,每个划分就是一个聚类,并且k<=n,同时还要满足两个要求:每个组至少包含一个对象,每个对象必须属于且仅属于一个组。



    SVD原理和计算:SVD隐语义模型最早在文本挖掘领域被提出,用于找到文本的隐含主题,也被称为主题模型。相关的名词有LSI、pLSA、LDA和Topic Model。隐语义模型的核心思想是通过隐含特征(Latent Factor)计算用户和物品的相似性。



猜你喜欢

转载自blog.csdn.net/QFire/article/details/80951738
今日推荐