python机器学习0基础到入门的心得----入门篇2 决策树 - 代码天地

python机器学习0基础到入门的心得----入门篇2 决策树

其他 2018-06-23 00:11:55 阅读次数: 2

什么是ID3决策树

使用决策树来处理分类问题, 同时也是经常使用的数据挖掘算法
输入测试集, 不断推断分解, 逐步缩小待猜测事物的范围, 划分出最优数据子集
将无序的数据变得更加有序
一次只选一个特征去划分最优数据子集

本章节代码

这里写图片描述
上面的图片就是决策树的最终展现图

优点

不需要了解算法
时间复杂度不高
数据易于展现
可以处理不相关特征

缺点:

可能会产生过度匹配, 会把没用的特征值全部展现出来

适用数据类型: 标称型

决策树术语

这里写图片描述椭圆形节点代表终止模块, 也叫叶子结点, 任何到达叶子结点的数据必然属于叶子结点的分类
正方形代表判断模块
从判断模块引出的左右箭头称作分支

原始香农熵: 表示数据的无序程度,混合的数据越多, 熵越高公式为这里写图片描述
信息增益: 在划分数据集之前之后信息发生变化叫做信息增益, 具体是累加原始香农熵, 计算出信息增益值, 熵越高, 信息增益值越低, 公式为

本人归纳:

找出划分数据集起决定性作用的特征, 接着划分出最优的数据子集
1. 如果某个分支下的数据属于同一类型, 则该节点称为叶子结点, 不需要在划分数据子集
2. 如果不属于同一类型, 则需要重复划分数据子集
要构造决策树, 就必须知道哪个特征在划分数据子集时起决定性作用, 每次评估一个特征(计算数据无序程度), 通过评估每个特征的熵(计算信息增益), 划分出最优子集, 把最优子集用可视化的方式展现出来就是决策树, 如果特征消耗完了,类别依然不是唯一, 最终会通过多数表决的方式决定叶子节点的分类

具体:
1. 选出起决定性作用的特征, 去重特征那列的值, 遍历不重复特征值, 划分出最优子集, 递归

猜你喜欢

转载自blog.csdn.net/qq351469076/article/details/80770310

python机器学习0基础到入门的心得----入门篇2 决策树

决策树篇

决策树（python）

python决策树

python 决策树

决策树--python

决策树的学习

决策树学习

【python和机器学习入门2】决策树2——决策树构建

决策树简介与入门

决策树基础篇

机器学习-决策树

机器学习——决策树

机器学习：决策树

机器学习----决策树

机器学习--决策树

决策树【机器学习】

【机器学习】：决策树

【机器学习】--决策树

机器学习---决策树

【机器学习】决策树

机器学习决策树

机器学习决策树

机器学习（决策树）

机器学习#决策树

机器学习_决策树

机器学习 - 决策树

机器学习（决策树二）——简述决策树

决策树《机器学习入门学习》

机器学习入门-决策树（一）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)