【機器學習筆記】xgboost中的min_child_weight參數理解。 - 代码天地

【機器學習筆記】xgboost中的min_child_weight參數理解。

其他 2018-05-11 16:04:30 阅读次数: 1

對於xgboost,min_child_weight是一個非常重要的參數，官方文檔描述如下：

minimum sum of instance weight (hessian) needed in a child. If the tree partition step results in a leaf node with the sum of instance weight less than min_child_weight, then the building process will give up further partitioning. In linear regression mode, this simply corresponds to minimum number of instances needed to be in each node. The larger, the more conservative the algorithm will be.

直譯即：決定最小葉子節點樣本權重和。如果在一次分裂中，葉子節點上所有樣本的權重和小于min_child_weight則停止分裂，能夠有效的防止過擬合，防止學到特殊樣本。

解釋什么是樣本的權重和：
對於回歸問題，在一個節點上的損失為：
这里写图片描述
這個表達式的相對於 $y_i hat$ 的二階導數為1。所以，對於這個節點上所有點的二階導數的加和，即所有樣本格數的和，即樣本權重和。在這裏，min_child_weight代表的意思是，儅一個節點下的樣本數小於給定的閾值時，則停止分裂！
對於二分類的邏輯回歸（a binary logistic regression）,在節點上每一個點的海森矩陣（hessian）的表達式是：
这里写图片描述
其中σ代表sigmod函數。所以對於所有衹有一個樣本的節點node，則，所有的 $y_i$ hat有可能是一個非常大的正數，則所有的都將接近1，則整個海森表達式接近於0，則在每個節點上的樣本權重都會接近於0，因此，此時min_child_weight代表一旦达到某个节点的纯度并停止尝试分裂，并且您的模型可以适合它。
海森矩陣是一個明智的選擇，能夠起到正則化并且限制樹的深度防止過擬合的作用。对于回归，很容易看出如果你总是用一个观察值分解到节点，你可能会过度拟合。同样，对于分类，如果你坚持分裂直到每个节点都是纯粹的，那麽也會導致過擬合的狀態。

參考：
1.https://stats.stackexchange.com/questions/317073/explanation-of-min-child-weight-in-xgboost-algorithm#
2.https://stats.stackexchange.com/questions/268276/what-does-min-child-weight-option-mean-in-xgboost-package-in-r-how-to-decide

猜你喜欢

转载自blog.csdn.net/m0_37477175/article/details/79991198

【機器學習筆記】xgboost中的min_child_weight參數理解。

學習hibernate筆記

Java學習筆記之JDK

背包九講學習筆記

JavaScript-WebGL學習筆記

spark學習筆記（1）

scala學習筆記（4）---類

「A tour of Go」學習筆記（二）

React官網零基礎學習筆記（2）-通過屬性傳遞數據

c#學習筆記--Visual Studio 擴展包管理器NuGet

React官網零基礎學習筆記（4）-瀏覽器工具

c#學習筆記--Visual Studio 使用

Linux 學習筆記 CH1

spark學習筆記（3)---集合計算

Java學習筆記(基本語法)

數論學習

機器學習基石上及其作業零 (機率統計、線性代數、微分之基本知識)

Web前端學習筆記之CSS基礎知識

React官網零基礎學習筆記（1）-本地環境搭建

The Go of the programming language of 2019(go語言學習筆記)

Linux 學習筆記 CH2 nginx+php+mysql

DateUtils學習記錄

React官網零基礎學習筆記（3）-創建交互組件

Git 初學筆記 - 指令操作教學

機器學習基石第一周学习笔记

機器學習基石(Machine Learning Foundations) 机器学习基石课后习题链接汇总

機器學習基石机器学习基石（Machine Learning Foundations）作业1 习题解答

斯坦福機器學習編程作業1

ID3决策树中连续值的处理+周志华《機器學習》图4.8和图4.10绘制

機器學習基石机器学习基石（Machine Learning Foundations）作业1 习题解答（续）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)