C4.5算法学习 - 代码天地

C4.5算法学习

其他 2019-09-08 11:31:12 阅读次数: 0

C4.5属于决策树算法的分类树决策树更是常见的机器学习方法，可以帮助我们解决分类与回归两类问题。以决策树作为起点的原因很简单，因为它非常符合我们人类处理问题的方法，而且逻辑清晰，可解释性好。从婴儿到长者，我们每天都使用无数次！

决策树的总体流程；

总体流程

分而治之（devide and conquer）

自根结点的递归过程

从每一个中间结点寻找一个划分（split and test）的属性

三种停止条件：

当前结点包含的样本属于同一类别，无需划分

当前属性集为空，或是所有样本在所有属性值上取值相同，无法划分

当前结点包含的样本集合为空，不能划分

核心数学概念：熵

信息熵（entropy）是度量样本集合“纯度”最常用的一种指标

C4.5算法流程

C4.5算法优缺点分析

优点：

（1）通过信息增益率选择分裂属性，克服了ID3算法中通过信息增益倾向于选择拥有多个属性值的属性作为分裂属性的不足；

（2）能够处理离散型和连续型的属性类型，即将连续型的属性进行离散化处理；

（3）构造决策树之后进行剪枝操作；

（4）能够处理具有缺失属性值的训练数据。

缺点：

（1）算法的计算效率较低，特别是针对含有连续属性值的训练样本时表现的尤为突出。

（2）算法在选择分裂属性时没有考虑到条件属性间的相关性，只计算数据集中每一个条件属性与决策属性之间的期望信息，有可能影响到属性选择的正确性。

算法详解：https://blog.csdn.net/zjsghww/article/details/51638126

算法程序

while（当前节点不纯）
1.计算当前节点的类别熵Info（D）(以类别取值计算)

2.计算当前节点的属性熵info(Ai)(按照当前属性取值下的类别取值计算)
3.计算各个属性的信息增益Gain(Ai) = Info(D)-info(Ai)

4.计算各个属性的分类信息度量H（Ai）(按照属性取值计算)

5.计算各个属性的信息增益率 IGR = Gain(Ai)/H(Ai)

and while

当前节点设置为叶子节点

猜你喜欢

转载自www.cnblogs.com/normaltang/p/11484771.html

C4.5算法学习

C4.5算法

C4.5算法详解

c4.5算法解读

机器学习之决策树(C4.5算法)

机器学习之C4.5算法原理

数据挖掘入门算法C4.5

决策树算法：C4.5

编程实现C4.5算法

Weka的-3.6.10的C4.5与Quinlan教授的C4.5算法的区别

Python机器学习 - 决策树 - （ID3算法、C4.5算法） - 代码实现

机器学习十大经典算法：（1）C4.5算法

机器学习总结（八）决策树ID3，C4.5算法，CART算法

C4.5

【机器学习算法】决策树-3 C4.5的字段选择方法，C4.5的数值型字段处理方式、C4.5的剪枝（避免过拟合）方法

机器学习(笔记)--决策树模型 ID3/C4.5/CART算法比较

机器学习算法总结(二)——决策树（ID3, C4.5, CART）

【机器学习】决策树（三）——生成算法（ID3、C4.5与CRAT）

《机器学习实战》之决策树ID3、C4.5、CART算法【二】

Python3实现机器学习经典算法（四）C4.5决策树

机器学习：决策树及ID3,C4.5,CART算法描述

机器学习算法（5）——决策树（ID3、C4.5、CART）

【机器学习算法】决策树模型ID3、C4.5、CART

机器学习回顾篇（7）：决策树算法（ID3、C4.5）

机器学习算法总结--决策树（ID3、C4.5、CART）

分类算法 -- 决策树C4.5算法

决策树分类算法：C4.5算法

决策树---C4.5算法的理解

决策树之 C4.5 算法

决策树C4.5算法详解

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)