决策树与熵、Gini不纯度计算

企业开发 2018-05-09 20:19:51 阅读次数: 7

要使用决策树，就必须计算不纯度，计算公式有熵和基尼不纯度

熵和基尼不纯度计算公式为：

举个例子，假设有样本：

	A1	A2
B1	2	8
B2	6	4

则开始的时候，熵值为：

E=-0.1*log2(0.1)-0.4*log2(0.4)-0.3*log2(0.3)-0.2*log2(0.2)=1.846

根据属性A划分样本，则两个子样本分别为：

	A1
B1	2
B2	6

	A2
B1	8
B2	4

两个子样本的熵分别为0.811和0.92，所以划分后总的样本（要乘于子样本比例）:(8/20)*0.811+(12/20)*0.92=0.88，同样可以计算按照属性B划分样本后样本熵值为：

	A1	A2
B1	2	8

子样本1，熵0.72

	A1	A2
B2	6	4

子样本2，熵0.97

（10/20）*0.72+(10/20)*0.97=0.845

可以看出，根据属性B划分后，总体的熵值更小，即样本混乱度更小，故根据B划分效果更好

同样可以根据计算基尼不纯度公式计算。实际使用中，熵值对于混乱的惩罚更小，使用熵的情况更多。

猜你喜欢

转载自onmyway-1985.iteye.com/blog/2083384

决策树与熵、Gini不纯度计算

决策树（信息熵、信息增溢、GINI）的计算

决策树中基尼不纯度初步理解

熵互信息 Gini指数和不纯度

基尼不纯度：如何用它建立决策树？

决策树基尼不纯净度（gini impurity）学习

基尼不纯度简介 - Gini Impurity

决策树总结 - 决策树Gini系数计算过程详细解答(七)

决策树--熵计算--特征分类

Decision Tree（决策树）-Entropy（熵）-Gini（基尼系数）

基于gini系数的决策树代码

【机器学习】决策树-Gini指数

【案例】利用决策树，计算香农熵

（决策树中的）信息熵和样本分类的信息熵计算源代码

决策树和信息熵

【深度学习基础-03】决策树算法-熵如何计算举例

决策树信息熵和信息增益的概念

机器学习实战===决策树熵的实现解释

决策树中的熵和基尼指数

Python实现——决策树实例(离散数据/香农熵)

信息熵与决策树的特征选择（理论+实例）

决策树--熵(Entropy)，互信息(Mutual Info)

信息熵与信息增益在决策树生成中的使用

【决策树】一文看懂图解决策树原理：信息熵、条件熵与信息增益

【机器学习】【决策树】用样本集详解：条件熵H(Y|X)的计算过程

CART 决策树的计算方法

决策树的相关知识点——信息熵，条件熵，量化度量指标

决策树 --- 决策树概要

决策树算法——熵与信息增益（Python3实现）

关于决策树后剪枝和最大熵模型的一些直观理解

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)