第四章：决策树 - 代码天地

第四章：决策树

其他 2019-04-25 09:51:11 阅读次数: 0

1.基本概念

一棵决策树包括一个根节点、若干个内部节点和若干个叶节点，根节点表示整个样本集，叶节点表示对应的决策结果，其基本算法如下

决策树递归完成的三种情况：（1）当前结点包含的样本全属于一个类别；（2）当前属性集为空，或所有样本在所有属性上取值相同；（3）当前结点包含的样本集为空。

2.划分选择

信息熵：排除冗余后的平均信息量，也就是代价。若当前样本集合D中第k类样本所占的比例为(），信息量的表达式为：，则信息熵的计算式为：，Ent(D)的值越小，D的纯度越高。

信息增益：用于描述两个概率分布之间的差异。用属性a对样本集D进行划分所得到的信息增益为：，其中表示第v个分支节点包含的了D中所在属性a上取值为的样本。信息增益越大，表示用属性a来进行划分所获得的纯度提升越大。ID3决策树在划分属性的时候选择以信息增益为准则，但其对可取数值多的属性会有所偏好。

增益率：，其中，称为属性a的“固有值”。C4.5决策树算法在划分属性的时候选择以增益率作为准则，但其对可取数目较少的属性有所偏好。

基尼指数：，其中基尼值为：，一般Gini（D)越小，D的纯度越高。CART决策树在划分属性时选择以基尼指数作为准则。

剪枝操作：通过减少一些叶节点的产生从而得到更好的效果，有预剪枝和后剪枝两种。前者是在决策树生成过程中对于不能提高决策树泛化性的节点不进行进一步叶节点划分，后者则是在决策树生成后对非叶节点进行考察，若叶节点替换子树可以提高决策树的泛化性则替换。预剪枝降低了过拟合的风险，同时还显著减少了决策树的训练时间开销和测试时间开销，不过可能带来欠拟合。后剪枝的欠拟合风险较小，同时泛化性能也优于预剪枝。

4.缺失值处理

在处理缺失值样本的时候我们一般近似的看作剔除缺失样本。

给定训练集D和属性a，是D中无缺失值的样本子集，表示中在属性a上取值为的样本子集，表示中属于第k类的样本子集我们定义以下三个变量：

无缺失值样本比例：

第k类样本所占比例：

无缺失样本中在a上取值为所占比例：

此时信息增益推广为，其中

猜你喜欢

转载自blog.csdn.net/qq_24852439/article/details/80638856

西瓜书第四章决策树

第四章：决策树

第四章决策树(代码待补)

西瓜书第四章--决策树

决策树机器学习第四章

读书笔记-《机器学习》第四章：决策树

小白学习机器学习---第四章：决策树

小白学习机器学习---第四章：决策树（2）

机器学习-第四章决策树读书笔记（周志华）

机器学习(周志华) 参考答案第四章决策树

周志华《机器学习》第四章决策树-调用sklearn.tree实现

周志华《机器学习》第四章决策树-编程尝试

【西瓜书笔记】——第四章：决策树

《机器学习西瓜书》学习笔记——第四章_决策树

机器学习(周志华) 参考答案第四章决策树 4.3

《机器学习》第四章决策树答案

读书笔记机器学习（周志华）第四章决策树

机器学习周志华第四章决策树相关知识理解

机器学习西瓜书第四章——决策树

西瓜书课后题——第四章（决策树）

西瓜书学习笔记——第四章：决策树

西瓜书第四章-决策树模型

机器学习复习笔记4 （第四章决策树）

机器学习西瓜书——第四章决策树

【一起啃书】《机器学习》第四章决策树

educoder-第四章决策树作业

读周志华《机器学习》第四章--决策树

【学习笔记】西瓜书机器学习之第四章：决策树

《机器学习》周志华学习笔记第四章决策树（课后习题）python 实现

数据挖掘导论学习笔记第四章分类：基本概念、决策树与模型评估

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)