个性化推荐系统

个性化推荐系统通过建立用户与信息产品之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐,其本质就是信息过滤。推荐算法主要有:协同过滤算法、基于内容的推荐系统、混合推荐系统、基于用户——产品二部图网络结构的推荐系统。

传统的搜索算法只能呈现给所有的用户一样的排序结果,无法针对不同的用户的兴趣爱好提供相应的服务,信息的爆炸使得信息的利用率反而下降,这种现象被称为信息超载。个性化推荐系统已经不仅仅是一种商业营销手段,更重要的是可以增进用户的黏着性。暗信息:在同样的用户喜好程度下,推荐冷门的产品要比推荐热门的产品意义更大,以电影为例,好的电影即使没有推荐,用户也可以通过广播、电视、网络等途径,也能够知道。但是对于冷门的信息,没有宣传,没有推荐,用户就无从得知。

一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块、分析用户喜好的模型分析模块、推荐算法模块。

1.协同过滤系统

  核心思想分为两部分:首先,利用用户的历史信息计算用户之间的相似性;然后,利用与目标用户相似性较高的邻居对其他产品的评价来预测目标用户对特定产品的喜好程度,系统根据这一喜好程度来对目标用户 进行推荐。协同过滤推荐系统最大的优点是对推荐对象没有特殊的要求,能处理音乐、电影等难以进行文本结构化表示的对象。在产品的数量相对稳定的系统中,这种方法是很有效的,但是对于产品数量不断增加的系统,这种方法是不适用的。协同过滤推荐系统面临新用户、新产品、打分稀疏性和算法可扩展性的问题。解决稀疏性是使用配置文件。

  协同过滤推荐系统的算法可以分为两类:基于记忆的和基于模型的算法。

  (1) 基于记忆的算法根据系统中所有被打过分的产品信息进行预测。

  (2) 基于模型的算法收集打分数据进行学习并推断用户行为模型,进而对某个产品进行预测打分。基于模型的协同过滤算法和基于记忆的算法的不同在于,基于模型的方法不是基于一些启发规则进行预测计算,而是基于对已有数据应用统计和机器学习得到的模型进行预测。

2.基于内容的推荐系统

  它不需要依据用户对项目的评价意见,而是依据用户已经选择的产品内容信息计算用户之间的相似性,进而进行相应的推荐。随着机器学习等技术的完善,当前的基于内容的推荐系统可以分别对用户和产品建立配置文件,通过分析已经购买过的内容,建立或更新用户的配置文件,系统可以比较用户与产品配置文件的相似度,并直接向用户推荐与其配置文件最相似的产品。基于内容的推荐算法的根本在于信息获取和信息过滤。基于内容的推荐系统不可避免的受到信息获取技术的约束,例如自动提取多媒体数据(图形、视频流、声音流)的内容特征具有技术上的困难。

  优点:

  (1) 可以处理新用户和新产品问题(冷启动)。由于新用户没有选择信息,新产品没有被选信息,因此协同过滤推荐系统无法处理这类问题,但是基于内容的推荐系统可以根据用户和产品的配置文件进行相应的推荐。

  (2) 实际系统中用户对产品的打分信息非常少,协同过滤推荐系统由于打分稀疏性的问题,受到很大的限制。基于内容的推荐系统可以不受打分稀疏性问题的约束。

  (3) 能推荐新出现的产品和非流行的产品,能够发现隐藏的“暗信息”。

  (4) 通过列表推荐项目的内容特征,可以解释为什么推荐这种产品,是用户在使用系统的时候具有很好的用户体验。

3.基于网络结构的推荐算法

  基于网络结构的推荐算法不考虑用户和产品的内容特征,而仅仅把它们看成抽象的节点,所有算法利用的信息都藏在用户和产品的选择关系之中。缺点:受到新用户和新产品等问题的制约。

4.混合推荐算法

  (1) 在协同过滤系统中加入基于内容的算法

  利用用户的配置文件进行传统的协同过滤计算。用户的相似度通过基于内容的配置文件计算而得到,而非共同打过分的产品的信息。这样可以克服协同过滤系统中的稀疏性问题。

5.关联规则

  关联规则关注用户的行为的关联模式,例如,购买香烟的人都会购买打火机。

  

  

猜你喜欢

转载自www.cnblogs.com/leeyuxin/p/10505422.html