推荐系统实战3

第3章 推荐系统冷启动问题

3.1 冷启动问题简介
冷启动问题主要分为3类:
  • 用户冷启动:用户冷启动主要解决如何给新用户做个性化推荐的问题。
  • 物品冷启动:主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。
  • 系统冷启动:系统冷启动主要解决如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统。
对于这3种不同的冷启动问题,有不同的解决方案。
  • 提供非个性化的推荐:推荐热门排行榜,然后等到用户收集到一定的时候,再切换为个性化推荐。
  • 利用用户注册时提供的年龄、性别等数据做粗粒度的个性化。
  • 利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品。
  • 要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息,然后给用户推荐那些和这些物品相似的物品。
  • 对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户。
  • 在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。
 
3.2 利用用户注册信息
用户注册信息分3种:
  • 人口统计学信息:包括用户的年龄,性别,职业,民族,学历和居住地。
  • 用户兴趣的描述:有一些网站会让用户描述他们的兴趣。
  • 从其他网站导入的用户站外行为数据
基于人口统计学特征的推荐系统典型代表是Bruce Krulwich开发的Lifestyle Finder。
一般来说,粒度越细,精度和覆盖率也会越高。说明利用的用户人口统计学特征越多,越能准确地预测用户的兴趣。
 
3.3 选择合适的物品启动用户的兴趣
解决用户冷启动问题的另一个方法是在新用户第一次访问推荐系统时,不立即给用户展示推荐结果,而是给用户提供一些物品,让用户反馈他们对这些物品的兴趣,然后根据反馈结果提供个性化推荐。
一般来说,能够用来启动用户兴趣的物品需要具有以下特点:
  • 比较热门
  • 具有代表性和区分性:启动用户兴趣的物品不能是大众化和老少皆宜的,因为这样的物品对用户兴趣没有区分性。
  • 启动物品集合需要多样性
可以利用决策树来结局如何设计一个选择启动物品集合的系统。
 
3.4 利用物品的内容信息
  第2章介绍了两种主要的推荐算法——UserCF与ItemCF算法。首先需要指出的是,UserCF算法对冷启动问题并不非常敏感。因为,UserCF在给用户进行推荐时,会首先找到和用户兴趣相似的一群用户,然后给用户推荐这一群用户喜欢的物品,在很多网站中,推荐列表并不是给用户展示内容的唯一列表,那么当一个新物品加入的时候,总会有用户从某些途径看到这些物品,对这些物品产生反馈。那么当一个用户对某个物品产生反馈后,和他历史兴趣相似的其他用户的推荐列表中就有可能出现这一物品,从而更多的人就会对这个物品产生反馈,导致更多的人的推荐列表中会出现这一物品,因此该物品就能不断扩散开来,从而逐步展示到对它感兴趣用户的推荐列表中。
  但是,有些网站中推荐列表可能是用户获取信息的主要途径,比如豆瓣网络电台。那么对于UserCF算法就需要解决第一推动力的问题,即第一个用户从哪儿发现新的物品,只要有一小部分人能够发现并喜欢新的物品,UserCF算法就能够将这些物品扩散到更多的用户中,解决第一推动力最简单的方法是将新的物品随机展示给用户,但这样显然不太个性化,因此可以考虑利用物品的内容信息,将新物品先投放给曾经喜欢过和它内容相似的其他物品的用户。
  对于ItemCF算法来说,物品冷启动就是一个严重的问题了。因为ItemCF算法的原理是给用户推荐和他之前喜欢的物品的相似的物品。ItemCF算法会每隔一段时间利用用户行为计算物品相似度表(一般一天计算一次),在线服务ItemCF算法会将之前计算好的物品相关度矩阵放在内存中。因此当新物品加入时,内存中的物品相关表中不会存在这个物品,从而ItemCF算法无法推荐新的物品。解决这一问题的办法是频繁更新新物品相似度表,但基于用户行为计算物品相似度是非常耗时的事情,主要原因是用户行为日志非常庞大。而且,新物品如果不展示给用户,用户就无法对它产生行为,通过行为日志计算是计算不出包含新物品的相关矩阵的。为此,我们只能利用物品的内容信息计算物品相关表,并且频繁更新相关表(比如半小时计算一次)。
   物品的内容信息多种多样,不同类型的物品有不同的内容信息。如果是电影,那么内容信息一般包括标题、导演、演员、编剧、剧情、风格、国家、年代等。如果是图书,内容信息一般包括标题、作者、出版社、正文、分类等。

3.5 发挥专家的作用
  很多推荐系统在建立时,既没有用户的行为数据,也没有充足的物品内容信息来计算准确的物品相似度。那么,为了在推荐系统建立时就让用户得到比较好的体验,很多系统都利用专家进行标注。这方面的代表系统是个性化网络电台Pandora和电影推荐网站Jinni。
  

转载于:https://www.cnblogs.com/chuwu6859/p/10993785.html

猜你喜欢

转载自blog.csdn.net/weixin_34314962/article/details/93497537
今日推荐