预测模型结果校准——前言

 

  1. 对于正负样本十分不均衡的问题,通常先进性负采样,然后再对模型进行校准,可参阅文献[1],博客中介绍了Prior Correction 和 Weighting方法。
  2. 利用分bin的方法,通过统计训练数据的CTR,对预测的CTR进行校准,建立预测CTR到校准后CTR的映射函数,比如Bining方法。
  3. 根据已有的先验知识,以预估值作为变量,观测值作为目标,用回归算法拟合参数。比如Platting Scaling 和Poisson Regression方法。
  4. 不涉及训练数据的CTR,直接通过Isotonic Regression算法,用预测的CTR 拟合训练数据样本的label(1:clicked; 0: not clicked),并保证保序,此外可以通过插值在保证保序的基础上对映射函数进行平滑。

参考文献:

[1] vividfee的博客:<面向稀有事件的 Logistic Regression 模型校准>

 http://vividfree.github.io/机器学习/2015/12/15/model-calibration-for-logistic-regression-in-rare-events-data

猜你喜欢

转载自blog.csdn.net/wangxiao7474/article/details/81083144
今日推荐