知识图谱和推荐系统-知识图谱的优势和融合方法

本文参考微信公众号- 微软研究院AI头条-上面的部分文章，仅用于参考学习笔记，想了解更多信息的可以关注公众号。原文链接----推荐算法不够精准？让知识图谱来解决

1. 推荐系统

传统的推荐系统只使用用户和物品的历史交互信息（显式或隐式反馈）作为输入，这会带来两个问题：一，在实际场景中，用户和物品的交互信息往往是非常稀疏（sparse）的。例如，一个电影类APP可能包含了上万部电影，然而一个用户打过分的电影可能平均只有几十部。使用如此少量的已观测数据来预测大量的未知信息，会极大地增加算法的过拟合（overfitting）风险；二，对于新加入的用户或者物品，由于系统没有其历史交互信息，因此无法进行准确地建模和推荐，这种情况也叫做冷启动问题（cold start problem）。

解决稀疏性和冷启动问题的一个常见思路是在推荐算法中额外引入一些辅助信息（side information）作为输入。辅助信息可以丰富对用户和物品的描述、增强推荐算法的挖掘能力，从而有效地弥补交互信息的稀疏或缺失。常见的辅助信息包括：

社交网络（social networks）：一个用户对某个物品感兴趣，他的朋友可能也会对该物品感兴趣；

用户/物品属性（attributes）：拥有同种属性的用户可能会对同一类物品感兴趣；

图像/视频/音频/文本等多媒体信息（multimedia）：例如商品图片、电影预告片、音乐、新闻标题等；

上下文（context）：用户-物品交互的时间、地点、当前会话信息等。

如何根据具体推荐场景的特点将各种辅助信息有效地融入推荐算法一直是推荐系统研究领域的热点和难点，如何从各种辅助信息中提取有效的特征也是推荐系统工程领域的核心问题。

2. 知识图谱

知识图谱的引入可以让推荐结果更加具有以下特征：

精确性（precision）。知识图谱为物品引入了更多的语义关系，可以深层次地发现用户兴趣；
在这里插入图片描述

多样性（diversity）。知识图谱提供了不同的关系连接种类，有利于推荐结果的发散，避免推荐结果局限于单一类型；
在这里插入图片描述
可解释性（explainability）。知识图谱可以连接用户的历史记录和推荐结果，从而提高用户对推荐结果的满意度和接受度，增强用户对推荐系统的信任。

知识图谱和物品属性的区别。物品属性可以看成是在知识图谱中和某物品直接相连的一跳（1-hop）的节点，即一个弱化版本的知识图谱。事实上，一个完整的知识图谱可以提供物品之间更深层次和更长范围内的关联，例如，“《霸王别姬》-张国荣-香港-梁朝伟-《无间道》”。正因为知识图谱的维度更高，语义关系更丰富，它的处理也因此比物品属性要更加复杂和困难。

这里说的对，在平时知识图谱的实验中，只用到了属性的信息，属性之间的联系没有考虑，这也是知识图谱融合推荐的难点。

一般来说，现有的可以将知识图谱引入推荐系统的工作分为两类：

以LibFM[1]为代表的通用的基于特征的推荐方法（generic feature-based methods）。这类方法统一地把用户和物品的属性作为推荐算法的输入。基于该类方法的通用性，我们可以将知识图谱弱化为物品属性，然后应用该类方法即可。
当然，这种做法的缺点也显而易见：它并非专门针对知识图谱设计，因此无法高效地利用知识图谱的全部信息。
以PER 、MetaGraph为代表的基于路径的推荐方法（path-based methods）。该类方法将知识图谱视为一个异构信息网络（heterogeneous information network），然后构造物品之间的基于meta-path或meta-graph的特征。
这类方法的优点是充分且直观地利用了知识图谱的网络结构，缺点是需要手动设计meta-path或meta-graph，这在实践中难以到达最优；同时，该类方法无法在实体不属于同一个领域的场景（例如新闻推荐）中应用，因为我们无法为这样的场景预定义meta-path或meta-graph。

3. 知识图谱特征学习

知识图谱特征学习（Knowledge Graph Embedding）为知识图谱中的每个实体和关系学习得到一个低维向量，同时保持图中原有的结构或语义信息。

基于距离的翻译模型（distance-based translational models）。这类模型使用基于距离的评分函数评估三元组的概率，将尾节点视为头结点和关系翻译得到的结果。这类方法的代表有TransE、TransH、TransR等；
基于语义的匹配模型（semantic-based matching models）。这类模型使用基于相似度的评分函数评估三元组的概率，将实体和关系映射到隐语义空间中进行相似度度量。这类方法的代表有SME、NTN、MLP、NAM等。

由于知识图谱特征学习为每个实体和特征学习得到了一个低维向量，而且在向量中保持了原图的结构和语义信息，所以一组好的实体向量可以充分且完全地表示实体之间的相互关系，因为绝大部分机器学习算法都可以很方便地处理低维向量输入。因此，利用知识图谱特征学习，我们可以很方便地将知识图谱引入各种推荐系统算法中。概括地说，知识图谱特征学习可以：

降低知识图谱的高维性和异构性；
增强知识图谱应用的灵活性；
减轻特征工程的工作量；
减少由于引入知识图谱带来的额外计算负担。