AdaBoostClassifier参数

Adaboost-参数:

  • base_estimator:基分类器,默认是决策树,在该分类器基础上进行boosting,理论上可以是任意一个分类器,但是如果是其他分类器时需要指明样本权重。
  • n_estimators:基分类器提升(循环)次数,默认是50次,这个值过大,模型容易过拟合;值过小,模型容易欠拟合。
  • learning_rate:学习率,表示梯度收敛速度,默认为1,如果过大,容易错过最优值,如果过小,则收敛速度会很慢;该值需要和n_estimators进行一个权衡,当分类器迭代次数较少时,学习率可以小一些,当迭代次数较多时,学习率可以适当放大。
  • algorithm:boosting算法,也就是模型提升准则,有两种方式SAMME, 和SAMME.R两种,默认是SAMME.R,两者的区别主要是弱学习器权重的度量,前者是对样本集预测错误的概率进行划分的,后者是对样本集的预测错误的比例,即错分率进行划分的,默认是用的SAMME.R。
  • random_state:随机种子设置。

关于Adaboost模型本身的参数并不多,但是我们在实际中除了调整Adaboost模型参数外,还可以调整基分类器的参数,关于基分类的调参,和单模型的调参是完全一样的,比如默认的基分类器是决策树,那么这个分类器的调参和我们之前的Sklearn参数详解——决策树是完全一致。

Adaboost-对象

  • estimators_:以列表的形式返回所有的分类器。
  • classes_:类别标签。
  • estimator_weights_:每个分类器权重。
  • estimator_errors_:每个分类器的错分率,与分类器权重相对应。
  • feature_importances_:特征重要性,这个参数使用前提是基分类器也支持这个属性。

Adaboost-方法

  • decision_function(X):返回决策函数值(比如svm中的决策距离)。
  • fit(X,Y):在数据集(X,Y)上训练模型。
  • get_parms():获取模型参数。
  • predict(X):预测数据集X的结果。
  • predict_log_proba(X):预测数据集X的对数概率。
  • predict_proba(X):预测数据集X的概率值。
  • score(X,Y):输出数据集(X,Y)在模型上的准确率。
  • staged_decision_function(X):返回每个基分类器的决策函数值。
  • staged_predict(X):返回每个基分类器的预测数据集X的结果。
  • staged_predict_proba(X):返回每个基分类器的预测数据集X的概率结果。
  • staged_score(X, Y):返回每个基分类器的预测准确率。

猜你喜欢

转载自blog.csdn.net/weixin_38648232/article/details/85084660
0条评论
添加一条新回复