决策树如何防止过拟合 - 代码天地

决策树如何防止过拟合

其他 2019-08-06 13:14:44 阅读次数: 0

决策树在长成的过程中极易容易出现过拟合的情况，导致泛化能力低。主要有两种手段可以用于防止过拟合。

提前停止

Early Stopping，在完全长成以前停止，以防止过拟合。主要有以下3种方式：

限制树的高度，可以利用交叉验证选择
利用分类指标，如果下一次切分没有降低误差，则停止切分
限制树的节点个数，比如某个节点小于100个样本，停止对该节点切分

后剪枝

提前停止的不足

“提前停止”是一个不错的策略，但是在实际的执行中会越到一些麻烦。比如「其中的第2点，如果下一次切分没有降低误差，则停止切分。」一看貌似很有道理，但是很容易举出反例：

对一个XOR的数据集生成决策树：
-w573

下面如果使用x[1]切分：
-w569

又或者用x[2]切分：
-w554

发现，无论选择哪一个维度进行切分都不会使得训练误差降低了。所以根据Early Stopping，仅仅长成只有一个节点的stump。但是实际上：
-w560

继续切下去，能学成一颗具有良好区分度的决策树。所以「提前停止」的第2种情况既有利也有弊：
-w395

剪枝

我们通过一颗决策树的叶子结点个数来定义这棵树有多复杂。
-w491

但是树太简单也不好，训练误差太大，欠拟合。所以，训练出一颗好的决策树就是在树的训练误差与复杂程度之间做权衡。
-w422

写成数学公式，可以表示为：
-w418
-w451

剪枝算法

举例说明

有一颗已经长成的树：
-w368

从底部开始考虑，第一个要检查的切分点是Term：
-w443

假设惩罚性lambda是0.3：

对于未剪枝的T，计算它的训练误差为0.25，叶子结点总数为6.所以总的cost为0.43
对于剪去Term的T_samller，计算它的训练误差为0.26，叶子结点总数为5.所以总的cost为0.41
因为剪去后的树的损失更小。所以决定剪枝。
接着对于所有的切分节点做上述相同的动作。

算法

-w393

猜你喜欢

转载自www.cnblogs.com/shayue/p/jue-ce-shu-fang-zhi-guo-ni-he.html

决策树如何防止过拟合

决策树过拟合

机器学习：决策树过拟合与剪枝，决策树代码实现（三）

决策树剪枝：解决模型过拟合【决策树、机器学习】

如何防止过拟合

如何防止过拟合(overfitting)

如何防止过拟合（OverFitting）

如何防止过拟合及欠拟合

机器学习-关键词：正则化、过拟合、决策树

【机器学习课程-华盛顿大学】：3 分类 3.4 决策树过拟合

正则化如何防止过拟合

机器学习如何防止过拟合

决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略

防止过拟合措施

防止过拟合的方法

防止过拟合的方法？

【DropOut】防止过拟合

tensorflow防止过拟合

防止过拟合以及解决过拟合

如何构建决策树--原理分析

机器学习总结之——如何防止过拟合

Tensorflow基础（五）--如何防止过拟合，Dropout的使用

ML之DT：基于决策树模型对iris鸢尾花数据集利用交叉验证训练并可视化的训练集和测试集的学习曲线进而判断拟合状态(过拟合/欠拟合)

如何使用代码实现决策树并绘制决策路径?

防止过拟合的基本方法

防止过拟合、dropout理解

防止过拟合的方法总结

tensorflow的dropout 防止过拟合

防止过拟合（二）：Dropout

决策树 --- 决策树概要

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)