XGBoost算法原理小结

其他 2020-02-25 10:19:09 阅读次数: 0

在两年半之前作过梯度提升树(GBDT)原理小结，但是对GBDT的算法库XGBoost没有单独拿出来分析。虽然XGBoost是GBDT的一种高效实现，但是里面也加入了很多独有的思路和方法，值得单独讲一讲。因此讨论的时候，我会重点分析和GBDT不同的地方。

本文主要参考了XGBoost的论文和陈天奇的PPT。

1. 从GBDT到XGBoost

作为GBDT的高效实现，XGBoost是一个上限特别高的算法，因此在算法竞赛中比较受欢迎。简单来说，对比原算法GBDT，XGBoost主要从下面三个方面做了优化：

一是算法本身的优化：在算法的弱学习器模型选择上，对比GBDT只支持决策树，还可以直接很多其他的弱学习器。在算法的损失函数上，除了本身的损失，还加上了正则化部分。在算法的优化方式上，GBDT的损失函数只对误差部分做负梯度（一阶泰勒）展开，而XGBoost损失函数对误差部分做二阶泰勒展开，更加准确。算法本身的优化是我们后面讨论的重点。

二是算法运行效率的优化：对每个弱学习器，比如决策树建立的过程做并行选择，找到合适的子树分裂特征和特征值。在并行选择之前，先对所有的特征的值进行排序分组，方便前面说的并行选择。对分组的特征，选择合适的分组大小，使用CPU缓存进行读取加速。将各个分组保存到多个硬盘以提高IO速度。

三是算法健壮性的优化：对于缺失值的特征，通过枚举所有缺失值在当前节点是进入左子树还是右子树来决定缺失值的处理方式。算法本身加入了L1和L2正则化项，可以防止过拟合，泛化能力更强。

在上面三方面的优化中，第一部分算法本身的优化是重点也是难点。现在我们就来看

猜你喜欢

转载自blog.csdn.net/jxq0816/article/details/103429961

XGBoost算法原理小结

XGBoost算法原理

xgboost算法原理与实战

xgboost 算法原理

XGBoost算法原理小结梯度提升树(GBDT)原理小结梯度提升树(GBDT)原理小结梯度提升树(GBDT)原理小结

GB、GBDT、xgboost算法原理

【Python】XGBoost原理小结及Python中的参数详解

XGBOOST—eXtreme Gradient Boosting算法原理

Boost算法（GDBT,AdaBoost，XGBoost）原理及实践

花了3周理解的xgboost算法原理

xgboost原理

随机森林算法原理小结

关于GBDT算法、XGBoost算法的基本原理概述

XGBoost算法

机器学习算法[9]--集成方法之XGBoost原理详解及XGBoost库实现

机器学习集成算法XGBoost原理及推导

介绍xgboost原理的好文（转载） xgboost原理

XGBoost 原理及应用 xgboost原理及应用--转

XGBoost类库使用小结

集成学习之Adaboost算法原理小结

Bagging与随机森林算法原理小结

朴素贝叶斯算法原理小结

XGBOOST原理解析

xgboost原理详解

xgboost的原理和实战

xgboost原理，公式推导

xgboost原理与推导

XGBoost原理剖析及实战

XGBoost原理简介

XGBoost_原理

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)