决策树算法原理(CART分类树) - 代码天地

决策树算法原理(CART分类树)

其他 2019-03-20 15:05:59 阅读次数: 0

来自：http://www.cnblogs.com/pinard/p/6053344.html

　　

　　在决策树算法原理(ID3，C4.5)中，提到C4.5的不足，比如模型是用较为复杂的熵来度量，使用了相对较为复杂的多叉树，只能处理分类不能处理回归。对这些问题，CART做了改进，可以处理分类，也可以处理回归。

1. CART分类树算法的最优特征选择方法

　　ID3中使用了信息增益选择特征，增益大优先选择。C4.5中，采用信息增益比选择特征，减少因特征值多导致信息增益大的问题。CART分类树算法使用基尼系数来代替信息增益比，基尼系数代表了模型的不纯度，基尼系数越小，不纯度越低，特征越好。这和信息增益（比）相反。

　　假设K个类别，第k个类别的概率为p_k，基尼系数表达式：

　　如果是二分类问题，第一个样本输出概率为p，基尼系数的表达式为：

　　对于样本D，假设K个类别，第k个类别的数量为C_k，则样本D的基尼系数表达式：

　　对于样本D，根据特征A的某个值a，把D分成D1和D2，则在特征A的条件下，样本D的基尼系数表达式为：

　　比较基尼系数和熵模型的表达式，二次运算比对数简单很多。尤其是二分类问题，更加简单。

　和熵模型的度量方式比，基尼系数对应的误差有多大呢？对于二类分类，基尼系数和熵之半的曲线如下：

　　基尼系数和熵之半的曲线非常接近，仅在45度角附近误差稍大。因此，基尼系数可以做为熵模型的一个近似替代。

　　CART分类树算法每次仅对某个特征的值进行二分，而不是多分，这样CART分类树算法建立起来的是二叉树，而不是多叉树。

猜你喜欢

转载自www.cnblogs.com/keye/p/10564914.html

决策树算法原理(CART分类树)

决策树——CART分类树算法

决策树算法原理(下) - CART

决策树算法：CART

决策树（CART算法）

Cart 决策树算法

决策树与分类算法之CART算法

数据挖掘-分类-决策树-CART

决策树原理及实现（二）--CART算法及剪枝

决策树算法小结(三) CART原理及代码实现

Cart决策树算法原理学习

决策树 cart

决策树（CART）

决策树CART

决策树---CART算法的理解

决策树之CART算法

决策树—CART算法及剪枝处理

决策树（CART）算法总结

【机器学习】决策树（下)CART算法分类树、回归树

决策树系列（三）：CART(分类回归树)-详细原理解析及代码

决策树分类原理

决策树的剪枝，分类回归树CART

【统计学习方法】决策树 CART生成算法分类树 Python实现

决策树分类算法

决策树-分类算法

【分类算法】决策树

决策树算法原理详解（ID3、C4.5、CART树）

第4章决策树算法【分类】（四 CART算法实现）

【python】决策树CART

CART决策树要点

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)