集成学习-stacking

参考文献:https://blog.csdn.net/Mr_tyting/article/details/72957853
stacking具体的算法流程
这里写图片描述
以上图为例,我们现在有训练集train_x,train_y,测试集test
① 我们首先选择一种模型比如随机森林rf。(未经训练)
②这里假设把训练集均分成5份,把其中四份作为小的训练集s_train_x,s_train_y另外一份作为小的测试集s_test,测试集test不变。
③我们以s_train_x,s_train_y训练rf模型,训练出的模型预测s_test得出对应的s_pred,再预测test得出y_pred。
④在训练集再选择另外一份作为小的测试集s_test_x,其他四份作为训练集训练模型rf。
⑤重复②,③,④步骤五次。我们会得到五个s_pred和五个y_pred。
五个s_pred作为一个train_X,原始的train_y作为train_Y训练模型得到模型G,五个y_pred取个平均值作为新的test_X,把test_X带入到模型G中得出预测结果。

猜你喜欢

转载自blog.csdn.net/csdn_lzw/article/details/80182031