ID3、C4.5、C5.0、CART决策树区别

编程语言 2019-02-27 08:50:53 阅读次数: 0

ID3决策树

ID3算法缺点：

对于具有很多值的属性它是非常敏感的，例如，如果我们数据集中的某个属性值对不同的样本基本上是不相同的，甚至更极端点，对于每个样本都是唯一的，如果我们用这个属性来划分数据集，它会得到很大的信息增益，但是，这样的结果并不是我们想要的。
ID3算法不能处理具有连续值的属性。
ID3算法不能处理属性具有缺失值的样本。
由于按照上面的算法会生成很深的树，所有容易产生过拟合现象。

C4.5算法

C4.5算法相对于ID3算法主要有以下几个改进:

用信息增益比来选择属性
在决策树的构造过程中对树进行剪枝
对非离散数据也能处理
能够对不完整数据进行处理

C5.0算法

C5.0算法相对于ID3算法主要有以下几个改进:

速度更快
更高效的内存使用
建立的决策树更小，C5.0获得的结果与C4.5非常相似，但构建了相当小的决策树。
类似的精度：C5.0获得与C4.5类似的精度。
Boosting支持：提升可以使决策树更准确。
加权：使用C5.0，您可以加权不同的属性和错误分类类型。C5.0可以构建分类器，以最大限度地减少预期的错误分类成本而不是错误率。
风选：为了帮助降低噪音，C5.0会自动获取数据。风选是指在分类之前检查属性，忽略它找到的属性只是略微相关。

CART算法

CART与C4.5算法是非常相似的，但是CART支持预测连续的值（回归。
CART构建二叉树，而C4.5则不一定。
CART用训练集和交叉验证集不断地评估决策树的性能来修剪决策树，从而使训练误差和测试误差达到一个很好地平衡点。

scikit-learn的实现为CART算法的最优版本，详细文档请参考：https://scikit-learn.org/stable/modules/tree.html

总结

	有很多值的属性	是否能处理缺失值	处理数据类型	是否剪枝
ID3	敏感	否	离散	否
C4.5	不敏感	是	离散、连续	是
C5.0	不敏感	是	离散、连续	是
CART	不敏感	是	离散、连续	是

参考文献

[1] https://blog.csdn.net/xlinsist/article/details/51468741
[2] https://blog.csdn.net/qq_27717921/article/details/74784400
[3] https://blog.csdn.net/gumpeng/article/details/51397737
[4] https://blog.csdn.net/leaf_zizi/article/details/83380081

猜你喜欢

转载自blog.csdn.net/E22644/article/details/87965778

ID3、C4.5、C5.0、CART决策树区别

R语言：决策树ID3/C4.5/CART/C5.0算法的实现

R_针对churn数据用id3、cart、C4.5和C5.0创建决策树模型进行判断哪种模型更合适

决策树（ID3、C4.5、CART）

决策树—ID3、C4.5、CART

决策树(ID3、C4.5、CART)

CART与ID3、C4.5决策树

决策树之ID3, C4.5与CART区别与联系

CART、C4.5、ID3 三种决策树的区别

ID3,C4.5和CART三种决策树的区别

决策树算法原理详解（ID3、C4.5、CART树）

机器学习(笔记)--决策树模型 ID3/C4.5/CART算法比较

决策树学习（下）——ID3、C4.5、CART深度剖析及源码实现

机器学习算法总结(二)——决策树（ID3, C4.5, CART）

决策树之ID3 ，C4.5 ，CART，理论+实例

Decision Tree决策树 ID3,C4.5,CART方法原理及伪代码

转载]决策树ID3、C4.5、CART科普

【机器学习】 ID3,C4.5,CART决策树

数据科学个人笔记：决策树算法（ID3、C4.5、CART）

《机器学习实战》之决策树ID3、C4.5、CART算法【二】

2. 决策树（Decision Tree）-ID3、C4.5、CART比较

决策树模型 ID3/C4.5/CART算法比较

决策树算法（ID3，C4.5，CART）

机器学习总结（八）决策树ID3，C4.5算法，CART算法

决策树(ID3,C4.5,CART)原理以及实现

决策树总结 ID3 C4.5 CART

机器学习 - 决策树（下）- CART 以及与 ID3、C4.5的比较

机器学习：决策树及ID3,C4.5,CART算法描述

机器学习笔记：决策树（ID3,C4.5,CART）

机器学习算法（5）——决策树（ID3、C4.5、CART）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)