推荐系统之--CB算法

今天开始介绍推荐算法：推荐算法分为两类

CB（Content--Base）基于内容的推荐算法

CF（Collaborative Filterin）基于协同过滤的推荐算法

今天我们就来讲讲关于CB算法，而其中CB算法包含如下两类：

1.引入Item属性的Content Base推荐：

工作原理：

我们在上一节推荐系统之--入门篇中的推荐系统流程梳理中得到：

1.上图中的item隶属于物品元数据信息，会先将所有的元数据信息，经过正排再倒排后存放至NoSQL索引数据库中就是上图

中的item内容属性索引。

2.User 进行页面浏览数据，在推荐引擎中的分词服务会将词语进行切分，给NoSQL索引数据库

3.返回大量的推荐列表信息

4.最后经过精排和去重，根据Top-N原则展示排名前5个的物品进行推荐。

通俗理解：

比如我们去京东购买手机，那么接下来基于Item属性来推荐相关的物品，如会推荐一些手机的耳机，手机套，手机贴膜等等。

优缺点：

优点	缺点
提升推荐结果的相关性【因为推荐的内容都是相似的东西】	无个性化【只能依赖于Item属性】
结果可解释【因为用户感知到了】	依赖于对Item的深度分析【只能依靠Item属性本身】
推荐结果容易被用户感知【用户买了手机，推荐手机膜这个过程】

2.引入User属性的Content Base推荐：

工作原理：

1.工作原理类似于Item属性的Content Base但是这里面引入了对用户行为数据的分析

2.这里的用户行为数据就是用户的历史行为信息比如说点击行为，观看列表，收藏行为等等

3.对这些行为进行分析建模，可以理解为在下一次给用户推荐的时候除了在展示页面除了推荐用户点击的内容以外，也会根据用户的历史行为信息，进行相关的推荐。增加用户的粘度。

通俗理解：

比如我们第二次去京东购买手机，那么接下来基于User属性来推荐相关的物品，如会推荐一些手机的耳机，手机套。但是在用户第一次购买了电脑，于是这一次也会推荐相应的电脑支架，键盘等物品给用户。

优缺点：

优点	缺点
用户模型刻画用户兴趣需求【根据用户行为信息建立画像】	推荐精度低【只利用物品本身的文本信息进行推荐】
推荐形式多样性，具有个性化	马太效应【喜欢刘德华，推荐更多刘德华的电影，滚雪球】
结果可解释【基于文本产生的推荐结果】	用户行为稀疏导致覆盖率低【不可能用户点击所有的物品信息，用户的信息少，课参考的维度少】

以上就是推荐系统CB算法后续不断更新中。。。