XGBoost学习笔记 - 代码天地

XGBoost学习笔记

其他 2018-10-14 04:33:17 阅读次数: 0

XGBoost是陈天奇等人提出的、非常流行的GBDT的变种。其代码库为https://github.com/dmlc/xgboost

XGBoost的教学视频https://www.youtube.com/watch?v=ufHo8vbk6g4

slides:https://www.slideshare.net/ShangxuanZhang/kaggle-winning-solution-xgboost-algorithm-let-us-learn-from-its-author

这个模型可以接受dense或者sparse的matrix作为input features，a numeric vector作为target vector，目标一般选为reg:linear或者binary:logistic，number_of_iterations是模型中加入的树的数目。eval_merics可以用来设定训练metric，一般用auc。classify的结果是概率而不是预测类别，这个需要注意。模型的training objective就是典型的boosting算法的objective。

在每一个iteration，模型会加入一棵新的树，所以在第t步，这一步的prediction就是由t棵树的结果构成的。

对于不同的objective，选择的损失函数分别为：

整个算法的目标是使上述损失函数最小化。

算法的正则化约束为如下图。主要取决于树的多少和树的复杂度。

我们使用梯度下降方法来优化目标。在这里我们同时考虑目标函数的一阶导和二阶导。当我们在t步时，我们已经有了t-1步生成的t-1棵树，所以只需要考虑第t棵树，即ft.

为了生成二阶导，我们对目标函数做二阶泰勒展开：

其中gi和hi分别是一阶偏导和二阶偏导。

我们把前t-1步已经优化过的目标删掉，就得到第t步的优化目标。

我们使用决策树来完成第t步的优化，即在每一步，我们都build一棵新的决策树。决策树从一棵空树开始build，在一个小步决定一个节点根据某个feature的某个位置进行分裂。

以上就是XGboost的基本情况，更多细节我们在Difference between Xgboost and lightgbm中阐述。

猜你喜欢

转载自blog.csdn.net/friyal/article/details/82756697

XGBoost算法--学习笔记

机器学习 xgboost 笔记

XGBoost学习笔记

20181125 XGBoost 学习笔记

XGBoost学习笔记2

机器学习笔记-XGBoost

【机器学习】XGBoost学习笔记

XGBoost学习笔记-基本概念

LR(Logistic Regression) & XGBOOST 学习笔记

Boosting学习笔记（Adboost、GBDT、Xgboost）

Python机器学习笔记：XgBoost算法

机器学习xgboost参数解释笔记

机器学习笔记12-----XGBoost实践

xgboost学习

集成学习:随机森林/GBDT/XGBoost (学习笔记一)

学习笔记(12):Kaggle 神器：XGBoost 从基础到实战-重回XGBoost

学习笔记(11):Kaggle 神器：XGBoost 从基础到实战-暂别XGBoost

学习笔记(10):Kaggle 神器：XGBoost 从基础到实战-初识XGBoost

学习笔记(10):Kaggle 神器：XGBoost 从基础到实战-All of XGBoost

【机器学习笔记】GBM以及xgboost的调参汇总

决策树、CART、GBDT、Xgboost学习笔记

Python机器学习笔记：XgBoost算法(亲测)

XGBoost 论文笔记

XGBOOST与GBD区别笔记

【机器学习】Xgboost算法

集成学习——Xgboost

机器学习----Xgboost与GBDT

机器学习--XGBoost

Xgboost之增量学习

【机器学习】：Xgboost原理

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)