XGBOOST—eXtreme Gradient Boosting算法原理 - 代码天地

XGBOOST—eXtreme Gradient Boosting算法原理

其他 2018-08-20 05:59:07 阅读次数: 0

XGBOOST算法是由华盛顿大学陈天奇博士以GBDT和RandomForest为基础提出的，并开发了C++版本。该算法由于精度高、可并行化处理和可移植性，被广泛应用于各个领域，这也是Kaggle竞赛者最常用的方法之一。

假设样本集D = {（xi， yi）...} i = 1、...n

XGBOOST预测函数可表示为

我们使用分部加法，可将此式变换为

其中K代表迭代K轮；方程左侧为预测值；映射fk如下：

目标函数：误差函数+正则化

所以目标函数就可变化为

由前面的公式，我们可知道

我们可以使用泰勒二阶展开：

接下来我们使用L2构建正则化函数：

最后目标函数可变换为：

对公式进行整理：

得到：

这里为了找到wj，我们可以求导，并令导数等于0，可以得到：

这里为了找出最优树结构，定义了结构分数就是上边的目标函数Obj，

利用枚举法来得到最优树结构集合，其结构会很复杂的，所以通常选择贪心法，对已有的叶节点，引入新的分裂点，这里我们要定义一个增益

其中GL为原叶节点左儿子的误差函数一阶导数之和；GL为原叶节点右儿子的误差函数一阶导数之和；

例如分裂点a

但由于又引进了一个新的量复杂度代价，所以增益衡量是否引进行的分裂还有一些问题，我们可以设置一个阀值，小于于阀值不引入新的分裂，大于阀值引入新的分裂。

XGBOOST还采用了随机森林的行随机和列随机，以及还针对缺失值的划分做了详细的讨论，详细了解可以看看陈天奇博士的论文。

XGBOOST的优缺点：

优点：

1、可分布式处理；

2、精度高；

3、可适应特征维度高的情况；

4、可移植性；

5、可有效防止过拟合；

6、噪音的鲁棒性强；

缺点：

1、调节参数复杂

参考

http://dataunion.org/15787.html

猜你喜欢

转载自blog.csdn.net/fengziyihang/article/details/79663050

XGBOOST—eXtreme Gradient Boosting算法原理

XGBoost（extreme gradient boosting）的使用例子

『Gradient Boosting 』LightGBM与XGBoost对比

Gradient Tree Boosting (GBM, GBRT, GBDT, MART)算法解析和基于XGBoost/Scikit-learn的实现

Gradient Boosting

【零散知识】gradient boosting的简单实践（xgboost）

梯度提升机（Gradient Boosting Machine）之 XGBoost

集成学习之Boosting —— Gradient Boosting原理

梯度提升树（Gradient Boosting Tree）算法原理

梯度提升（Gradient Boosting）算法

AdaBoost和Gradient Boosting算法实现

XGBoost + Boosting 原理简介

Gradient Boosting Decision Tree

07_Ensemble Learning and Random Forests_02_AdaBoost_Gradient Boosting_XGBoost

Gradient Boosting Decision Tree (GBDT)

GBDT(Gradient Boosting Decision Tree)

Boosting算法（GBDT，XGBoost，LightGBM）

【机器学习算法推导】AdaBoost与GBDT（Gradient Boosting Decision Tree）

机器学习算法之——梯度提升（Gradient Boosting）

集成学习之Boosting —— Gradient Boosting实现

集成学习——Boosting算法：Adaboost、GBDT、XGBOOST和lightGBM的简要原理和区别

机器学习：GBDT（Gradient Boosting Decision Tree）

GBDT(Gradient Boosting Decision Tree)入门（一）

GBDT(Gradient Boosting Decision Tree)入门（二）

Gradient Tree Boosting:梯度提升树详解

Tree - Gradient Boosting Machine with sklearn source code

梯度提升(Gradient boosting)和GBDT

GBDT(Gradient Boosting Decision Tree)粗探

[机器学习] Boosting算法3 --- XGBoost

机器学习--boosting家族之XGBoost算法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)