初级算法梳理--决策树 - 代码天地

初级算法梳理--决策树

其他 2019-05-07 12:21:18 阅读次数: 0

学习内容：

1. 信息论基础（熵联合熵条件熵信息增益基尼不纯度）

2.决策树的不同分类算法（ID3算法、C4.5、CART分类树）的原理及应用场景

3. 回归树原理

4. 决策树防止过拟合手段

5. 模型评估

6. sklearn参数详解，Python绘制决策树

1、信息论基础

1.1 熵

信息的定义为，如果待分类的事务可能划分在多个分类之中，则符号 $\large x_{i}$ 的信息定义为：

$\large l(x_{i})=-logp(x_{i})$ ，底数为2，其中 $\large p(x_{i})$ 是选择该分类的概率。

熵定义为信息的期望值，需要计算所有类别所有可能值包含的信息期望值：

$H = -\sum_{i=1}^{n} p(x_{i})l(x_{i})=-\sum _{i=1}^{n} p(x_i)log(p(x_i))$

1.2 联合熵

没看懂

1.3 条件熵

$\large H(X,Y)-H(X)=-\sum_{x,y} p(x,y)lnp(y|x)$

1.4 信息增益

在划分数据集之前之后信息发生的变化，称为信息增益。

1.5 基尼不纯度

从一个数据集中随机选取子项，度量其被错误分类到其它分组里的概率。

2、决策树的不同分类算法

算法	原理	应用场景
ID3算法	使用信息增益生成决策树	分类
C4.5	使用信息增益比生成决策树	分类、连续值与缺失值处理
CART分类树	基尼指数	既可用于分类也可用于回归

3、回归树原理

4、决策树防止过拟合手段

剪枝，降低复杂度，解决过拟合

5、模型评估

分类准确率

6、sklearn参数详解

基于默认的方法：

criterion 用来分裂节点的指标，默认为‘gini’，即基尼指数
splitter 拆分策略，一般都默认‘best’

max_depth 最大深度

min_samples_split 对于中间节点分裂的最少样本数

min_samples_leaf 叶子节点的最少样本数

max_features 最大特征数目

min_weight_fraction_leaf 叶子节点站的比重

一般而言深度与叶子节点数量是互斥控制的。

7、python绘制决策树

猜你喜欢

转载自blog.csdn.net/l422380631/article/details/89000788

初级算法梳理--决策树

【算法梳理】决策树

决策树算法梳理

Datawhale-初级算法梳理-Day3-决策树算法梳理

转载：决策树算法梳理

算法基础梳理——决策树

算法梳理（三）决策树算法梳理

决策树基础梳理

机器学习算法梳理(三)：决策树

机器学习初级算法之决策树

决策树算法

决策树学习算法

决策树算法（下）

决策树算法（上）

决策树算法总结

4、决策树算法

决策树分类算法

决策树算法实现

决策树算法实例

决策树回归算法

决策树算法笔记

决策树算法及实现

决策树算法：CART

决策树算法整理

决策树算法框架

决策树算法原理

决策树算法的研究

决策树（CART算法）

决策树相关算法

决策树算法(四)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)