数据挖掘十大经典算法之--ID3介绍 - 代码天地

数据挖掘十大经典算法之--ID3介绍

其他 2020-02-13 18:43:26 阅读次数: 0

数据挖掘十大经典算法之–ID3

1.算法介绍

ID3是Quinlan提出的一个著名的决策树生成方法。

ID3的基本概念如下：

1.决策树中的每一个非叶子节点对应着一个非类别属性，树枝代表这个属性的值，一个叶子结点代表从树根到叶子结点之间的路径对应的记录所属类别的属性值。

2.每一个非叶子结点都将与属性中具有最大信息量的非类别属性相关联。

3.采用信息增益来选择出能够最好的将样本分类的属性。

2.信息增益

信息增益（Kullback–Leibler divergence）又叫做information divergence，relative entropy 或者KLIC。信息增益基于信息论中熵（Entropy）的概念。熵是对应的属性的不确定性的度量。一个属性的熵越大，它蕴含的不确定信息越大。

在概率论和信息论中，信息增益是非对称的，用以度量两种概率分布P和Q的差异。信息增益描述了当使用Q进行编码时，再使用P进行编码的差异。通常P代表样本或观察值的分布，也有可能是精确计算的理论分布。Q代表一种理论，模型，描述或者对P的近似。

计算公式如下：

在这里插入图片描述

3.具体方法

从根结点开始，对结点计算所有可能的特征的信息增益，选择信息增益最大的特征作为结点的特征，由该结点的不同取值建立子结点；再对子结点递归地调用以上方法，构建决策树；直到所有特征的信息增益均很小或没有特征可以选择为止。最后得到一个决策树

九岁ya

发布了43 篇原创文章 · 获赞 45 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/mzc_love/article/details/103176273

数据挖掘十大经典算法之--ID3介绍

数据挖掘经典十大算法_ID3算法

数据挖掘之十大经典算法

数据挖掘十大经典算法（十）-----CART

数据挖掘十大经典算法

数据挖掘十大经典算法 .

数据挖掘十大经典算法----简介

数据挖掘十大经典算法（七）-----AdaBoost

数据挖掘十大经典算法（转载）

数据挖掘十大经典算法（八）----KNN

十大经典数据挖掘算法：SVM

十大经典数据挖掘算法：EM

数据挖掘领域的十大经典算法

【十大经典数据挖掘算法】EM

数据挖掘领域十大经典算法初探

数据挖掘的十大经典算法

数据挖掘领域十大经典算法

【十大经典数据挖掘算法】SVM

数据挖掘十大经典算法原理

数据挖掘领域十大经典算法之—CART算法（超详细附代码）

大数据挖掘领域十大经典算法之—CART算法（附代码）

数据挖掘十大经典算法之KNN算法

数据挖掘领域十大经典算法之—SVM算法

数据挖掘十大经典算法之K-means 算法

数据挖掘领域十大经典算法之—SVM算法（超详细附代码）

数据挖掘十大经典算法之——CART 算法

数据挖掘十大经典算法之——Apriori 算法

数据挖掘十大经典算法之——PageRank 算法

数据挖掘十大经典算法之——SVM 算法

数据挖掘十大经典算法之——Naive Bayes 算法

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)