前言:
- 2018年发表在WSDM的会议。
- 通过卷积神经网络(CNN)对短期序列的信息进行提取。
- 作者认为相对于用户的通用偏好(general preference),最近的行为模式显得更为重要,这与STAMP模型,注重短期记忆的想法是相似的。
- 不过本文最有趣的地方不是模型的构建,而是在引言部分构建的很多模式、规则。
概要:
序列模式的定义
文章针对FPMC等基于马尔可夫链的序列推荐方法的限制性,总结出三种序列模式,如下图:
point-level
:基于马尔可夫链的模型便是这种序列模式,蓝色的序列行为都只是单独的影响下一个行为;union-level,no skip
:(b)中就是一种联合的序列模式,同时考虑三个蓝色行为对下一个行为的影响;union-level,skip once
:作者还考虑了一种跳跃的行为。
数据集的序列强度
为了验证union-level
的影响以及skip behaviors
,作者通过一种关联规则衡量序列强度,并在两个数据集上进行了检验:
模型结构:
Caser模型包含三个部分:
- Embedding层对用户、物品序列进行密集型表示,用户的表示可以理解为用户的
general preference
; - 卷积层(CNN)学习用户短期(时间内)的序列特征;
- 全连接层将拼接的序列特征与用户偏好映射到用户在当前时间与每个物品交互的可能性;
模型结构如下所示:
Embedding层
卷积层
水平卷积
垂直卷积
全连接层
网络训练:
实验:
数据集
指标
实验结果
总结: