【分类模型】决策树 - 代码天地

【分类模型】决策树

其他 2020-04-20 17:47:48 阅读次数: 0

文章目录

1.决策树模型
2.外卖决策树
3.分类算法——ID3算法(1986)

1.决策树模型

在这里插入图片描述

2.外卖决策树

三个属性：食堂是否营业，账号是否有红包，是否疲劳。
两个结果：点外卖，吃食堂。
决策树的形成重点在属性的选取，在能分类出来的情况下，属性越少越好。

样本	学生	红包	食堂营业	…	结果
1	1	0	1	…	吃食堂
2	0	1	1	…	点外卖
3	1	1	0	…	点外卖
…	…	…	…	…	…
n	1	0	0	…	吃食堂

3.分类算法——ID3算法(1986)

ID3算法是在每个节点处选取能获得最高信息增益的分支属性进行分裂。
衡量样本集合纯度的指标：熵，熵值越小，不确定程度越小。定义如下：

$Entropy(S)=-\sum_{i=1}^mP_i*log2^{P_i}$
其中 $P_i$ 即为大样本中分类第 $i$ 种结果的频率,即为概率。

举个简单例子帮助理解熵值，比如说如果有一个大小为10的布尔值样本集合 $S$ ，其中真值有6个，假值有4个，则该布尔型样本分类的熵值为：

$Entropy(S)=-\sum_{i=1}^2P_i*log2^{P_i}= -\frac{6}{10}log2^{\frac{6}{10}}-\frac{4}{10}log2^{\frac{4}{10}}=0.9710$

是否知道一个属性对前后两个熵值的影响较大，说明该属性较重要，本质就是属性对熵值的影响程度大小与该属性的重要程度成正比。

$max(Gain(S,A))=Entropy(s)-\sum_{i=1}^v\frac{S_i}{S}Entroy(S_i)$

通过上式“有放回地”计算每个属性的信息增益值，其中 $\frac{S_i}{S}$ 是一种熵值比赋权，确定最大的信息增益的属性，选取该属性作为最重要的属性，构建决策树的节点。
确定最大的信息增益的属性，选取该属性作为最重要的属性，构建决策树的节点。

发布了22 篇原创文章 · 获赞 3 · 访问量 3105

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_39920026/article/details/103955055

【分类模型】决策树

分类——决策树模型

Python——决策树分类模型剪枝

决策树分类

决策树—分类

决策树 – 分类

分类-决策树

基于决策树构建鸢尾花数据的分类模型并绘制决策树模型

机器学习中---分类模型--决策树模型

决策树模型

基于决策树模型对 IRIS 数据集分类

监督学习分类模型决策树

决策树分类原理

决策树分类算法

决策树的iris的分类

分类：决策树——剪枝

分类——决策树归纳

分类问题：决策树

决策树-分类算法

【分类算法】决策树

[DM]分类-决策树

使用决策树分类

树模型与线性模型的区别决策树分类和逻辑回归分类的区别【总结】

决策树(二)：分类决策树

决策树模型小结

决策树与集成模型

经典决策树模型

决策树模型介绍

决策树思维模型

决策树模型（二）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)