Netflix prize大赛获奖者的模型中包含了特定天的参数,那么一个明显的问题就是如何使用这些模型来预测未来的评分呢?
一个简单的处理方式就是对于未来(未训练)的日期,特定日期的参数应该取默认值。也就是对于式:
设为
,
设为0。
如果我们不能使用这些特定天的参数来预测未来的日期,那这些参数在什么地方才有用呢?毕竟,预测只有关乎未来才是有用的
为了使这个问题更清晰,我们需要提到这样一个事实:在Netflix数据集中包括了很多用户在某些日期只有一条评分记录的数据,因此,特定日期的参数不能使用。
为了回答这个问题,需要注意时序化建模并没有试图捕获未来的变化。Netflix的时序化建模试图做的是捕获瞬息万变的动态时序,这些动态时序对用户过去的反馈有很大的影响。当识别出这些时间效应时,应该对它们进行向下调整,以便能够对更加持久化的信号建模。这样,模型就可以更好地捕获数据的长期特征,而使用精心设计的参数来表示短期波动。例如,如果一个用户某天给出了很多比平时评分要高的评分,模型将会对这些评分给予一定的折扣,因为考虑到这可能是用户在特定天的参数完成了一种数据清理工作,而这种数据清理提高了对未来日期的预测准确度。
Netflix的推荐的推荐模型包含了特定天的参数,那么netflix是如何使用这些天数来预测未来的评分呢?
猜你喜欢
转载自blog.csdn.net/weixin_43631296/article/details/86410681
今日推荐
周排行