个性化推荐系统方向简单介绍

先介绍下的我们这边目前推荐系统的做的两个大方向:

         1、基于自然语言处理的用户短期和长期兴趣+rank 排序。

           推荐方法:a)、基于topic&keywrods等信息构建的video profile+用户行为+rank 排序构建的online or offline推荐.

                         目前我们的方向是构建:基于topic+keywords和基于item(video)上的用户行为特征构建图关系的item(video)的网状videos profile&connection

         目前构建video profile: 是基于item profile的keyword提取(Text rank+word2vec),并构建基于keyWords和topic关系分类体系(基于keywords聚类(kmeans+word2vec)加上人工审核和自己添加)

   ,基于keyWords+topic信息+视频本身属性+协同过滤+关联规则等挖掘出来的信息构建videos profile&connection

         2、 基于用户画像和视频打分协同过滤推荐和item(video)相关度去热的挖掘,(偏向offline推荐方式)

       推荐方法:

           i)、结合应用内部的行为日志、进行统计分析构建item(video) 粒度评分矩阵的协同推荐

           ii)、基于行为分析和item profile构建用户画像的协同推荐

           协同推荐方法:

     a)基于邻域推荐算法:UserCF&ItemCf等

     b)、隐预约模型(Latent class model,后面我都简称 LCM) ,即矩阵分解模型:如SVD++,RSVD 等

  

          这两简单介绍下的,什么是LCM?该模型将user和item关联起来,它不认为用户并不是直接对物品产生兴趣。而是用户对几个类别有兴趣,而物品属于不同的类别,

      因此这个模型会通过行为数据学习出这些类别,以及用户对这些类别的兴趣。LCM和咱们目前基于用户兴趣构建的topic+keywords推荐方式很像。但是矩阵分解不好解释,控制也不好控制,

相比来说业务如果能够引入自然语言处理基础topic+keywords的推荐方式稍微好点,优化方向比较明确。是LCM 是通过用户行为分析出来的,所以人和更贴近生态规律。

         目前咱们这边的个性化推荐更多的在优先做1,2等1上线后再做2,因为1的产出速度快。对于2,我们会优先挖掘去热后的关联规则挖掘(

这里会遇到说的稀疏问题:解决稀疏问题的两个算法:扩散和热传导),后期慢慢的做评分矩阵和user profile的协同过滤[优化1的不足]


猜你喜欢

转载自blog.csdn.net/map_lixiupeng/article/details/51123629