【机器学习笔记】Decision Trees（决策树） - 代码天地

【机器学习笔记】Decision Trees（决策树）

其他 2020-02-18 15:25:16 阅读次数: 0

内容概述

通俗地讲，决策树提出一个问题，然后根据回答者的答案将回答者区分。
决策树图中，最上面的只有指出箭头的结点称为“根结点”，中间既有指入又有指出的结点称为“内部结点”，下方只有指入箭头的绿色结点称为“叶结点”。
那么决策树应该如何建立呢？
根结点该如何选择？
作出每个特征的树状图后，通过算法计算出每个特征与心脏疾病的相关性。
我们将使用“Gini（基尼）”来比较它们谁更不纯。
将根结点确定下来后，确定后续结点同样需要使用Gini不纯系数，并确保每个结点的不纯系数取最小值。
上述例子中只使用了布尔值（True or Flase），增加数值后又该如何建立决策树呢？
增加选项值后，应该如何计算它的Gini不纯系数？

通俗地讲，决策树提出一个问题，然后根据回答者的答案将回答者区分。

决策树图中，最上面的只有指出箭头的结点称为“根结点”，中间既有指入又有指出的结点称为“内部结点”，下方只有指入箭头的绿色结点称为“叶结点”。

那么决策树应该如何建立呢？

在下面的例子中，我们打算通过Chest Pain、Good Blood Circulation和Blocked Arteries来预测一名患者是否得心脏疾病。

因此，我们需要在三个特征中选择一个作为根结点。

根结点该如何选择？

选择与心脏疾病最相关的特征。

依次对比每个特征列与结果列的每一行数值，作出每个特征的树状图。

比如，某个患者得了Chest Pain，那我们就沿True路径往下走，如果该患者还得了心脏疾病，那么叶结点中的Yes+1，否则No+1。如此类推.....

作出每个特征的树状图后，通过算法计算出每个特征与心脏疾病的相关性。

注意：因为没有一个特征树的叶结点是百分百Yes或者No，所以它们都被认为是不纯的（impure）。

我们将使用“Gini（基尼）”来比较它们谁更不纯。

（说法有点怪怪的///）

1. 通过Figure 1中的算式来算出两个叶结点的Gini不纯系数；

2. 通过Figure 2中的算式来算出根结点（即某个特征）的Gini不纯系数（不纯系数越低越好）；

这种算法在后面还会用到。

Figure 1：

Figure 2：

将根结点确定下来后，确定后续结点同样需要使用Gini不纯系数，并确保每个结点的不纯系数取最小值。

上述例子中只使用了布尔值（True or Flase），增加数值后又该如何建立决策树呢？

第一步：对数值进行排序；

第二步：计算每个相邻数值间的平均值；

第三步：计算每个平均值的Gini不纯系数；

增加选项值后，应该如何计算它的Gini不纯系数？

——计算所有选项组合的不纯系数。

至肝主义圈毛君

发布了153 篇原创文章 · 获赞 184 · 访问量 5万+

私信关注

猜你喜欢

转载自blog.csdn.net/Ha1f_Awake/article/details/102940883

【机器学习笔记】Decision Trees（决策树）

决策树(Decision Trees)

机器学习算法之：决策树 (decision trees)

【ML】决策树（Decision trees）

监督学习之六——决策树（Decision Trees）

机器学习笔记——决策树算法（Decision Tree）

机器学习实战笔记：决策树（Decision Tree）

[机器学习笔记] （四）决策树 Decision Tree

优达学城机器学习之--决策树(Decision Trees)

机器学习-决策树（decision tree）

机器学习-决策树 Decision Tree

决策树（Decision Tree)学习笔记

【机器学习】决策树(Decision Tree)原理

机器学习（三）——决策树（decision tree）算法介绍

机器学习算法——决策树（Decision Tree）

机器学习之决策树（Decision Tree）

机器学习之决策树 Decision Tree（一）

机器学习之决策树(Decision Tree)

机器学习算法之决策树（Decision Tree）

机器学习(二)之决策树(Decision Tree)

机器学习之Decision tree(决策树)

机器学习技法之决策树（Decision Tree）

【机器学习】8：决策树原理（Decision Tree）

知识点｜机器学习-决策树（Decision Tree）

机器学习&深度学习基础（机器学习基础的算法概述及代码）决策树学习笔记（Decision Tree）

机器学习决策树学习笔记

决策树（Decision Tree）

决策树——Decision Tree

决策树decision tree

决策树 Decision Tree

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)