主要阶段
step1 :抽取用户相关特征,用xgboost,分数 0.5 - 0.6
step2 : 样本特征具有很严重的不平衡性,通过离散化处理, 使用NN来预测, 分数 0.64
step3 : 全面抽取特征,用xgboost,分数0.55
step4 : 抽取leak特征,用xgboost,分数 0.58
step5 : 尝试gbdt + 参数优化, 分数0.734
step6 : 特征选择 ,RF,分数在0.72左右浮动
为什么xgboost的准确率比gbdt和rf都要低很多