Xgboost理解 - 代码天地

Xgboost理解

其他 2019-02-21 15:14:42 阅读次数: 0

一、xgboost模型函数形式

　　xgboost也是GBDT的一种，只不过GBDT在函数空间进行搜索最优F的时候，采用的是梯度下降法也就是一阶泰勒展开；而xgboost采用的是二阶泰勒展开也就是牛顿法，去每次逼近最优的F，泰勒展开越多与原函数形状越接近，比如在x₀处进行展开，其展开越多，x₀附近与原函数值越接近，且这个附近的区域越大。另外一个xgboost加入了正则化项，有效防止过拟合。

　　xgboost与GBDT都是采用的cart树中的回归树来解决所有问题，回归树的预测输出是实数分数，可以用于回归、分类、排序等任务中。对于回归问题，可以直接作为目标值，对于分类问题，需要映射成概率，比如采用逻辑回归的sigmoid函数。

additive表示附加的，所谓additive training我的理解就是一部分训练误差，另一部分是正则项用以约束参数。

误差函数尽量去拟合训练数据，正则化项则鼓励更加简单的模型。因为当模型简单之后，有限数据拟合出来结果的随机性比较小，不容易过拟合，使得最后模型的预测更加稳定。

二、目标函数

1）参数空间的目标函数

参数空间的目标函数指在构建单棵树的时候如何选择最优的参数。

误差函数可以是square loss，logloss等，正则项可以是L1正则，L2正则等。正则项如果从Bayes角度来看，相当于对模型参数引入先验分布：

L1正则，模型参数服从拉普拉斯分布，对参数加了分布约束，大部分取值为0。

L2正则，模型参数服从高斯分布，对参数加了分布约束，大部分绝对值很小。

2）函数空间的目标函数

函数空间的目标函数是多棵树一起构建的目标损失函数，求解多棵树一起的整体最优解。

第二部分正则项对每一棵回归树的复杂度进行了惩罚，使得学习出来的模型不容易过拟合。

哪些指标可以衡量树的复杂度呢？

树的深度，内部节点个数，叶子节点个数，叶子节点分数等。

xgboost采用叶子节点个数T和叶子节点分数w对树的复杂度进行约束：

对叶子节点个数进行惩罚，相当于进行了剪枝。

猜你喜欢

转载自www.cnblogs.com/gczr/p/10412609.html

Xgboost理解

xgboost的理解

XGBOOST原理解析

Xgboost通俗理解

GB、GBDT、XGboost理解

理解Kaggle神器——Xgboost

深入理解XGBoost

XGBoost深度理解

Adaboost、GBDT、XGBoost的对比理解

我理解的GBDT跟XGBOOST

Xgboost通俗理解和总结

gbdt xgboost 贼难理解！

sklearn、XGBoost、LightGBM理解与调参

集成学习——XGBoost原理理解

花了3周理解的xgboost算法原理

xgboost原理（无推导就轻易理解）

XGboost

【XGBOOST】

xgboost：

对xgboost和lightgbm的理解及其调参应该关注的点

通俗理解kaggle比赛大杀器xgboost

一步一步理解GB、GBDT、xgboost

XGBoost模型理解（python实现）与GBDT/RF模型对比

深入理解XGBoost：分布式实现

机器学习项目中Xgboost深入理解（二）梯度及GB的理解

【機器學習筆記】xgboost中的min_child_weight參數理解。

【数据分析案例】从XGBoost算法开始，更好地理解和改进你的模型

XGBoost 中特征重要性和特征选择原理解析与实战

从L2R开始理解一下xgboost的 'objective': 'rank:pairwise'参数

XGBoost最通俗版的公式推导与原理解释，超详细！！

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)