梯度提升树（GBDT）理解 - 代码天地

梯度提升树（GBDT）理解

其他 2018-11-03 16:39:20 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_34886403/article/details/82704940

GBDT是集成学习方法Boosting中的一种，所以其中每个弱分类器都有先后顺序，同时每个弱分类器都有其的权重。

GBDT的思想
在GBDT的迭代过程中，假如前一轮迭代得到的强分类器是 $F_{m-1}(x)$ ,而其的损失函数为 $L(y,F_{m-1}(x))$ ,这是本轮的的迭代就是找一个CART回归树模型（弱分类器） $T(x;\theta_m)$ ，让本轮的损失 $L（y,F_{m-1}+\rho_m T(x;\theta_m)）$ 最小。简单说，就是本轮要找个决策树，使得已有的强分类器的损失变小。

“GBDT的核心”
Freidman提出用损失函数的负梯度来表示本轮损失的近似值，进而确定CART树。

假如迭代到第M轮，这时损失函数的负梯度就可以表示为如下：

g_{m i} = - [\frac{\partial L (y_{i}, F_{m} (x_{i}))}{\partial F (x_{i})}]_{F (x) = F_{m - 1} (x)}

$g_{mi}=-[\frac{\partial L(y_i,F_m(x_i))}{\partial F{(x_i)}}]_{F(x)=F_{m-1} \ (x)}$
其中i=1，2···N表示样本数。

这个负梯度就是本轮迭代的损失值，也就是我们优化CART树的标签。即有：

θ_{m} = a r g m i n_{α, β} \sum_{i = 1}^{N} [g_{m i} - β T_{m} (x_{i}; θ)]^{2}

$\theta_m=argmin_{\alpha,\beta}\sum_{i=1}^{N}[g_{mi}-\beta T_m(x_i;\theta)]^2$
这里用

T_{m} (x; θ)

$T_m(x;\theta)$ 去拟合上面提到的“标签”，而且使用了最小二乘法的拟合方法。

同时每个弱分类器都有其的权重，这里我们可以理解成“步长”：

ρ_{m} = a r g m i n_{ρ} \sum_{i = 1}^{N} L (y_{i}, F_{m - 1} (x_{i}) + ρ T (x_{i}, θ_{m}))

$\rho_m=argmin_{\rho} \sum_{i=1}^NL(y_i,F_{m-1}(x_i)+\rho T(x_i,\theta_m))$

最后迭代完这轮后，得到的强分类器 $F_m(x)=F_{m-1}(x)+\rho_m T(x;\theta_m)$

猜你喜欢

转载自blog.csdn.net/qq_34886403/article/details/82704940

梯度提升树（GBDT）理解

对梯度提升树(GBDT)的通俗理解

梯度提升树，GBDT

梯度提升树(GBDT)原理

梯度提升树GBDT原理

（十五）梯度提升树（GBDT）

梯度提升树GBDT总结

GBDT梯度提升树（一）

GBDT 梯度提升决策树笔记

GBDT：梯度提升决策树

梯度提升回归树 GBDT java

梯度提升决策树GBDT

梯度提升回归树（GBDT）

GBDT（梯度提升决策树）剖析

GBDT梯度提升树原理剖析

梯度提升树(GBDT)原理小结

机器学习——梯度提升树(GBDT)

转： GBDT 梯度提升树相关

GBDT 梯度提升决策树简述

【机器学习】GBDT梯度提升树

梯度提升树（GBDT）原理总结

机器学习 - 梯度提升树 GBDT

机器学习之梯度提升树（GBDT）

一文看懂提升树与梯度提升树（GBDT）

梯度提升树(GBDT)原理小结梯度提升树(GBDT)原理小结

提升树和梯度提升树的理解

集成树--Boosting Tree与GBDT(梯度提升树)

XGBoost算法原理小结梯度提升树(GBDT)原理小结梯度提升树(GBDT)原理小结梯度提升树(GBDT)原理小结

GBDT(梯度提升决策树)与GBRT(梯度提升回归树)原理详解

梯度提升决策树-GBDT（Gradient Boosting Decision Tree）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)