ML:随机森林、GBDT、XGBoost - 代码天地

ML:随机森林、GBDT、XGBoost

其他 2019-03-31 11:30:59 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/ShellDawn/article/details/88876603

RF、GBDT、XGBoost都属于集成学习。
通过结合多个基学习器都预测结果来改善单个学习器的泛化能力。

集成学习分为两大类：

boosting：个体学习器之间存在强依赖关系、必须串行生成的序列化方法。
bagging：个体学习器之间不存在强依赖关系，可同时生成的并行化方法。

RF：
提到随机森林就不得不提Bagging。
Bagging简单理解为，放回抽样、多数表决。

1、随机选择样本（放回抽样，每棵树采用60%样本）
2、随机选择特征，每个决策树只选特征集合的子集，然后再采用最优划分。
3、构建决策树，每棵决策树最大可能生长不剪枝，过拟合。
4、随机森林投票，分类任务采用简单投票法，回归任务采用简单平均法。

起始性能较差，随着学习器数目增多，收敛到更低的泛化误差。
在噪声较大的分类或回归问题上容易过拟合。

能够处理高纬数据，在训练完毕后，给出特征的重要性。

GBDT：

不得不提boosting。
每个新分类器根据已经训练的分类器的性能来训练。
Boosting通过关注被已有分类器错分的那些数据来获得新的分类器。
（注意：错分的数据）

每一次计算都是为了减少上一次的残差。

GradientBoost中，使之前的模型残差往梯度下降的的方法。
利用损失函数的负梯度在当前模型的值作为残差的近似值，进而拟合一颗CART回归树。

GBDT都是CART回归树、而不是分类树。

扫描二维码关注公众号，回复： 5721751 查看本文章

优点：灵活处理各类型数据。
缺点：难以并行训练数据。

XGB：

最大的认知在于其能够自动运用CPU多线程进行并行计算。

GBDT在优化时只用到一阶导数，XGB对代价函数进行二阶太累展开，得到一阶和二阶导数。

XGB在代价函数中加入了正则项，用于控制模型对复杂度。
shrinkage（缩减），相当于学习率，XGB在进行完一次迭代时，会将叶子节点的权值乘上该系数，消弱每棵树的影响，让后面有更大的学习空间。

XGB对分裂节点处理上做了优化。

猜你喜欢

转载自blog.csdn.net/ShellDawn/article/details/88876603

ML:随机森林、GBDT、XGBoost

随机森林，xgboost, gbdt

随机森林，GBDT，XGBoost的对比

随机森林、GBDT、XGBoost比较

ml课程：决策树、随机森林、GBDT、XGBoost相关（含代码实现）

机器学习之随机森林、GBDT、Xgboost

ML-集成学习：AdaBoost、Bagging、随机森林、Stacking(mlxtend)、GBDT、XGBoost、LightGBM、CatBoost原理推导及实现

决策树、Bagging、随机森林、Boosting、AdaBoost、GBDT、XGBoost

集成学习:随机森林/GBDT/XGBoost (学习笔记一)

随机森林及GBDT

随机森林与GBDT

随机森林 vs GBDT

GBDT,随机森林

利用随机森林、GBDT、xgboost、LightGBM计算准确率和auc

第四章（1.1）机器学习——RF(随机森林)、GBDT、XGBoost算法

决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结

【机器学习】集成学习算法使用与对比（随机森林、GBDT、XGBoost、LightGBM等）

[ML]随机森林

随机森林和GBDT的学习

GBDT和随机森林的区别

随机森林和GBDT的区别

集成学习:随机森林.GBDT

集成学习、Bagging集成原理、随机森林构造过程、随机森林api与案例、boosting集成原理、梯度提升决策树(GBDT）、XGBoost与泰勒展开式

通过５折交叉验证，实现逻辑回归，决策树，SVM,随机森林，GBDT,Xgboost,lightGBM的评分

【机器学习】５折交叉验证的评分-模型逻辑回归，决策树，SVM,随机森林，GBDT,Xgboost，lightGBM

决策树ID3、C4.5、CART、随机森林、bagging、boosting、Adaboost、GBDT、xgboost

【ML】随机森林（Random Forest）

ML06-随机森林

机器学习(七)随机森林,GBDT,Adaboost

GBDT与随机森林算法的原理以及区别

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)