机器学习：决策树 - 代码天地

机器学习：决策树

其他 2018-06-22 10:14:18 阅读次数: 3

信息熵：

变量X有多种取值x1,x2,x3...xi...xn，

现有一样本，用各种取值的频率近似作为概率用，求得：

p1,p2,p3...pi...pn

熵

这里的log可以以2,10，e为底，反正后面要用的是熵的差值或比值。

信息增益：

g(D,A)=样本原本熵H(D)-用A特征分类后的熵H(D|A)

H(D|A)算法：假设D被A分为多组，D1,D2...Di...，每组的样本数量n1,n2...ni...

H(D|A)=∑(ni/n)·H(Di)

信息增益缺点：会偏向取值多的特征

信息增益率：

实质是g(D,A)乘以一个惩罚系数，

A取值越多，这个惩罚系数越小，

缺点：偏向取值少的特征。

gini不纯度：只能处理二分类特征，

对于多分类特征，用one-against-rest，先找到一个gini最小的分点，变为二分类。

预剪枝：树生成过程中，对每个结点判断是否应该作为叶结点。

后剪枝：完整树生成后，从叶到根逐个非叶结点判断是否应该作为叶结点。

连续值处理：离散化

方法：值排序，相邻两两相加，得到的点作为候选划分点，找到一个信息增益最高的点作为划分点。

缺失值处理：每次计算只在本特征非缺失样本中进行。

猜你喜欢

转载自blog.csdn.net/rona1/article/details/80760855

机器学习-决策树

机器学习——决策树

机器学习：决策树

机器学习----决策树

机器学习--决策树

决策树【机器学习】

【机器学习】：决策树

【机器学习】--决策树

机器学习---决策树

【机器学习】决策树

机器学习决策树

机器学习决策树

机器学习（决策树）

机器学习#决策树

机器学习_决策树

机器学习 - 决策树

机器学习（决策树二）——简述决策树

机器学习树模型——决策树

机器学习决策树学习笔记

决策树《机器学习入门学习》

机器学习-决策树与集成学习

机器学习——决策树学习

机器学习之决策树

机器学习算法总结--决策树

机器学习实战——决策树（二）

机器学习入门-决策树（一）

机器学习----决策树（二）

机器学习之三：决策树

机器学习实战——决策树（一）

机器学习----决策树（一）

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)