假如有如下训练数据:
(x1,明天),(x2,后天),(x3,大后天)。
其中第一项x
表示一个事件,第二项表示该事件发生的时间。
现在需要你训练一个模型,能够给定事件x
作为输入,输出其发生的时间。
乍一看是一个分类(classification)问题。
但是如果采用普通的分类方法,由于以上标签会被one-hot
编码成:
(x1,(1,0,0)),(x2,(0,1,0)),(x3,(0,0,1))。
所以分类的时候,当预测错了类别的时候,损失是一样的。因为one-hot
编码中类别之间距离是一样的。
即给定x
,如果模型预测的结果是明天。我们会发现真实标签是后天或者大后天都是一样的损失。这不合理,因为我们观察到这些标签有顺序关系,预测结果是明天时,真实标签是大后天应该比后天带来更大的损失才对,因为更加遥远,更加错误。
解决办法:有序回归
。
为了突显有序可以将以上数据编码成
(x1,0),(x2,1),(x3,2)。