轻松理解C4.5和ID3的区别和联系 - 代码天地

轻松理解C4.5和ID3的区别和联系

其他 2019-06-12 10:31:13 阅读次数: 0

前言:

最近老师讲解决策树的ID3算法和C4.5算法，但是他讲的不是很透彻，今天我想自己给他弄明白！

简介:

C4.5算法是由Ross Quinlan开发的用于产生决策树的分类算法，C4.5是ID3的升级版本，既然是升级的，必定会比ID3厉害很多，那么它在那些方面增强了呢?算法实现上又有什么区别呢？

改进:

通过信息增益率选择属性
处理连续型数据的属性
能够进行剪枝操作
能够对空缺值进行处理

离散型数据和连续型数据?

离散变量是指其数值只能用自然数或整数单位计算的则为离散变量
在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的

改进目的:

1.ID3算法是通过信息增益选择属性，当某特征种的特征值很多时，信息增益会很大，也就是ID3算法在选择属性的时候会偏向多个属性值的属性作为分裂属性的不足

2.ID3只能对离散型的数据进行处理，改进后的C4.5能够将连续型数据离散化

3.采用了一种后剪枝方法

避免树的高度无节制的增长，避免过度拟合数据
该方法使用训练样本集本身来估计剪枝前后的误差，从而决定是否真正剪枝

4.空缺值处理方法:

采用抛弃缺失值
补充缺失值
概率化缺失值:对缺失值的样本赋予该属性所有属性值的概率分布,即将缺失值按照其所在属性已知值的相对概率分布来创建决策树

如何计算信息增益率?

计算类别信息熵
计算每个属性的信息熵
计算信息增益
计算属性信息分裂度量
计算信息增益率

前三个步骤其实就是ID3算法的计算过程，如果不会的话请在我的有关ID3决策树中学习(下面是三个步骤的公式):

之后的两个步骤其实在前三个步骤基础上的一个进一步的计算

如果这块计算不懂得话你可以参考这个博客他又具体实例的计算步骤: https://blog.csdn.net/fuqiuai/article/details/79456971

C4.5优点与缺点:

优点：产生的分类规则易于理解，准确率较高。
缺点：在构造树的过程中，需要对数据集进行多次的顺序扫描和排序，因而导致算法的低效。此外，C4.5只适合于能够驻留于内存的数据集，当训练集大得无法在内存容纳时程序无法运行。

猜你喜欢

转载自blog.csdn.net/m0_43432638/article/details/90111175

轻松理解C4.5和ID3的区别和联系

决策树之理解ID3算法和C4.5算法

决策树ID3和C4.5的区别

ID3,C4.5和CART三种决策树的区别

决策树之ID3, C4.5与CART区别与联系

决策树ID3和C4.5算法实现

决策树ID3算法和C4.5算法实战

算法-基于ID3和C4.5的决策树算法

决策树模型之ID3算法、C4.5算法和CART算法

决策树中的ID3、C4.5和CART算法的对比分析

【面试考】【入门】决策树算法ID3，C4.5和CART

决策树-ID3算法和C4.5算法

ID3、C4.5、C5.0、CART决策树区别

Decision Tree：ID3、C4.5

（七）决策树（ID3、C4.5）

决策树（ID3、C4.5、CART）

Decision Tree——ID3、C4.5、CART

决策树—ID3、C4.5、CART

决策树(ID3、C4.5、CART)

决策树（ID3、C4.5）

CART与ID3、C4.5决策树

决策树算法-ID3、C4.5

［每日问答］ID3,C4.5,CART的区别是什么？

CART、C4.5、ID3 三种决策树的区别

【机器学习】决策树(一)----学习步骤和常用算法ID3以及C4.5

《统计学习方法》决策树 ID3和C4.5 生成算法 Python实现

【机器学习（四）】决策树、ID3算法、C4.5算法、CART算法：原理，案例和代码

决策树总结 - 归纳总结决策树的ID3,C4.5和CART的构建过程(六)

信息熵(ID3)、信息增益（C4.5）、基尼值和基尼指数

【转】深入浅出理解决策树算法（二）-ID3算法与C4.5算法

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)