Netflix的推荐的推荐模型包含了特定天的参数,那么netflix是如何使用这些天数来预测未来的评分呢?

Netflix prize大赛获奖者的模型中包含了特定天的参数,那么一个明显的问题就是如何使用这些模型来预测未来的评分呢?
一个简单的处理方式就是对于未来(未训练)的日期,特定日期的参数应该取默认值。也就是对于式: b u i = μ + b u + α u d e v u ( t u i ) + b u , t u i + b i + b i , B i n ( t u i ) c u ( t ) b_{ui}=\mu+b_u+\alpha_u\cdot dev_u(t_{ui})+b_{u,t_{ui}}+(b_i+b_{i,Bin(t_{ui})})\cdot c_u(t)
c u ( t u i ) c_u(t_{ui}) 设为 c u c_u b u , t u i b_{u,t_{ui}} 设为0。
如果我们不能使用这些特定天的参数来预测未来的日期,那这些参数在什么地方才有用呢?毕竟,预测只有关乎未来才是有用的
为了使这个问题更清晰,我们需要提到这样一个事实:在Netflix数据集中包括了很多用户在某些日期只有一条评分记录的数据,因此,特定日期的参数不能使用。
为了回答这个问题,需要注意时序化建模并没有试图捕获未来的变化。Netflix的时序化建模试图做的是捕获瞬息万变的动态时序,这些动态时序对用户过去的反馈有很大的影响。当识别出这些时间效应时,应该对它们进行向下调整,以便能够对更加持久化的信号建模。这样,模型就可以更好地捕获数据的长期特征,而使用精心设计的参数来表示短期波动。例如,如果一个用户某天给出了很多比平时评分要高的评分,模型将会对这些评分给予一定的折扣,因为考虑到这可能是用户在特定天的参数完成了一种数据清理工作,而这种数据清理提高了对未来日期的预测准确度。

发布了13 篇原创文章 · 获赞 10 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/weixin_43631296/article/details/86410681