XGBoost推导 - 代码天地

XGBoost推导

其他 2018-09-05 11:38:58 阅读次数: 0

输入样本集\(\{(x_1,y_1),\cdots ,(x_N,y_N)\}\),对于每个样本，其损失函数为

$$L(F_m(x_i),y_i)$$

其中\(F_m(x_i)\)表示已经学习到的\(m\)棵树对\(y_i\)的预测。

考虑所有样本的损失

$$L_m=\sum_{i=1}^N L(F_m(x_i),y_i) + \gamma \left |T\right | + \lambda \Omega (f)$$

现在要求第\(m+1\)棵树，即求得一颗树\(f_{m+1}\)使得以下目标函数最小,

$$L_{m+1} =\sum_{i=1}^N L(F_m(x_i)+f_{m+1}(x_i),y_i)+\gamma T +\lambda \sum_{i=1}^T w_i^2$$

对该目标函数在\(F_m(x_i)\)处进行二阶泰勒展开

$$\sum_{i=1}^N L(F_m(x_i)+f_{m+1}(x_i),y_i) = \sum_{i=1}^N L(F_m(x_i),y_i)+g_if_{m+1}(x_i)+\frac{1}{2}h_if_{m+1}^2(x_i) +\gamma T +\lambda \sum_{i=1}^T w_i^2$$

其中\(g_i=\frac{\partial L_{m+1}}{\partial F_m(x)}|_{x=x_i}\), \(h_i=\frac{\partial^2 L_{m+1}}{\partial F_m^2(x)}|_{x=x_i}\) ，\(T\)表示叶子节点的数目，\(w_j\)表示第\(i\)个叶子节点值。

因为每个样本点都被映射到了唯一一个叶子节点，令\(I_j\)表示映射到第\(j\)个节点的样本序号的集合，上式可以转换为对叶子节点的求和。

扫描二维码关注公众号，回复： 3065850 查看本文章

$$L_{m+1}=\sum_{i=1}^N L(F_m(x_i)+f_{m+1}(x_i),y_i)=\sum_{j=1}^T (\sum_{i\in I_j}g_i)w_j+\frac{1}{2}(\sum_{i\in I_j}h_i)w_j^2+\gamma T+\lambda w_j^2+constant$$

求上述目标函数关于\(w_j\)的导数

$$\frac{\partial L_{m+1}}{\partial w_j}=\sum_{i\in I_j}g_i+(\sum_{i\in I_j}h_i+2\lambda) w_j=0$$

$$w_j^*=-\frac{\sum_{i\in I_j}g_i}{\sum_{i\in I_j}h_i+2\lambda}$$

将\(w_j^*\)代入原目标函数得

$$L_{m+1}=-\frac{1}{2}\sum_{j=1}^T \frac{(\sum_{i\in I_j})^2}{\sum_(i\in I_j)+2\lambda}+\gamma T$$

XGBoost在寻找最优分裂点时是寻找能够使得目标函数减少最多的分裂点。

猜你喜欢

转载自blog.csdn.net/Xafter0/article/details/81126278

XGBoost推导

xgboost介绍以及推导

xgboost原理，公式推导

xgboost原理与推导

xgboost推导与调参

Xgboost推导及分析

XGBoost 完整推导过程

XGBoost算法推导及参数配置

xgboost目标函数推导过程

xgboost等集成学习原理推导

1.XGBOOST算法推导

XGBoost目标函数公式推导

【机器学习】xgboost系列丨xgboost原理及公式推导

xgboost算法的手写推导

XGBoost原理推导与实践——复习篇

集成学习之Xgboost超详细推导

机器学习18-XGBoost的推导过程

xgboost原理（无推导就轻易理解）

XGBoost算法讲解和公式推导

XGBoost二阶泰勒展开公式推导

机器学习集成算法XGBoost原理及推导

xgboost 原论文精读原理推导 + sklearn参数讲解

《机器学习公式推导与代码实现》chapter12-XGBoost

XGboost

【XGBOOST】

xgboost：

跟我学算法-xgboost(集成算法)基本原理推导

XGBoost最通俗版的公式推导与原理解释，超详细！！

ML-集成学习：AdaBoost、Bagging、随机森林、Stacking(mlxtend)、GBDT、XGBoost、LightGBM、CatBoost原理推导及实现

xgboost小试

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)