【数据产品案例】如何将知识图谱特征学习应用到推荐系统？

案例来源：@AI科技大本营

1. 知识图谱应用到推荐系统中的三种方式

1）依次学习：先训练知识图谱模型，得到实体和实体关系的向量表示；再将该向量作为推荐模型的输入

2）联合学习：将知识图谱和推荐系统的目标函数结合，使用端到端的方式训练

3）交替学习：将知识图谱和推荐系统的训练放在一起，使用多任务学习的框架进行训练

2. 依次学习 - Deep Knowledge-Aware Network (DKN)

1）引入知识图谱特征：

a. 实体连接：将文中发现的词汇与实体进行匹配

b. 知识图谱构建：根据匹配的实体，从知识图谱中抽取出子图

c. 知识图谱特征学习：使用知识图谱特征学习算法（如TransE）学习实体的向量表示

d. 实体的上下文实体特征：一个实体e的上下文是实体的一跳近邻，e的上下文表示就是一跳近邻特征的平均值

2）构建推荐模型

a. 基于卷积神经网络的文本特征提取：新闻标题词向量、实体向量、实体上下文向量作为多通道，在CNN框架下进行融合

b. 基于注意力机制的用户历史兴趣融合：在判断用户对当前新闻的兴趣时，使用注意力网络给用户历史记录分配不同的权重

3）依次学习的优势在于将知识图谱训练与推荐系统训练分离，前者更新少、训练开销大。但缺点也来源于此，无法端到端训练，知识图谱的训练并不是为了推荐目标而来，不一定适应特定的推荐任务

3. 联合学习 - Collaborative Knowledge base Embedding (CKE)

1）对于结构数据（如导演、电影名）：采用TransR进行学习，可以得到实体的特征表示

2）对于文本数据：采用去燥自编码器抽取向量化特征

3）对于图像数据：采用卷积-反卷积自编码器抽取向量化特征

4）将以上三种知识学习的目标函数与协同过滤的目标函数结合，得到以下联合损失函数

5）使用梯度下降法训练

4. 联合学习 - Ripple Network

1）基本思想：用户的兴趣以历史记录中的实体为中心，向外扩散并逐渐衰弱

2）过程【看不懂】：

5. 交替学习 - Multi-task Learning for KG enhanced Recommendation (MKR)

1）出发点：推荐算法中的物品和知识图谱中的实体存在重合，两者的学习存在相关性，两者信息可以互补

2）框架如图：

a. 左侧推荐任务的输入是用户和物品，输出是点击概率

b. 右侧知识图谱学习的任务输入是三元组和关系表示，输出是特征表示

c. 中间设计了交叉特征共享单元：

3）优势：知识图谱特征学习模块在下一次训练中可以继续使用，不用像联合学习一样从头开始学习