机器学习笔记(三)--决策树 - 代码天地

机器学习笔记(三)--决策树

其他 2019-03-17 23:52:36 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/LawGeorge/article/details/79548548

学习机器学习算法之决策树，这个大侠的文章写得不错：http://www.cnblogs.com/yonghao/p/5061873.html

总结一下：

1.对于信息熵的理解：

选假设有一个离散型随机变量X有4中可能的结果：A-1/2，B-1/4，C-1/8，D-1/8，后面的是每种结果的发生概率。那么如果顺序的去猜测X，就会有以下事件可能发生：问到A，命中A，用一次，问A->B，命中B，用两次，问A->B->C,命中C，用三次，问A->B->C,不命中C但是只剩下D自然就会命中D，用三次，所以平均次数=1/2×1+1/4×2+1/8×3+1/8×3=1/2×log2(2)+1/4*log2(4)+1/8*log2(8)+1/8*log2(8)=1.75bit。说明用计算机对X的取值编码的平均长度为1.75个bit(这里引用知乎回答，可以比较形象体会一下信息的量化)。在获得随机变量后会得到信息，那么定义这信息增益量为：log(pi^-1),即对应概率的倒数的对数。总的来说，信息熵是用来刻画数据集合复杂度的统计量，信息熵越大越复杂越没有达到分类的目的，数据集就越不纯。注意在公式中的对数的底数取值可以有不同，一般取2单位是bit，也有取e的单位信息单位奈特nat，只要>1就可以。

2.交叉熵：

描述两个数据集合相似程度的度量方法。用交叉熵代替成本函数，通过量化正确结果集与预测结果集的相似程度及交叉熵，就可以快速下降。

猜你喜欢

转载自blog.csdn.net/LawGeorge/article/details/79548548

机器学习笔记（三）决策树

机器学习笔记（三）：决策树

机器学习笔记(三)--决策树

《机器学习实战》学习笔记三：决策树

机器学习源码学习笔记（三）决策树

《机器学习》学习笔记三决策树

机器学习（西瓜书）学习笔记（三）---------决策树

机器学习入门学习笔记（三）决策树

周志华-机器学习-笔记（三）-决策树

机器学习决策树学习笔记

机器学习之三：决策树

机器学习(其三)决策树

机器学习算法（三）：决策树

机器学习（三）----决策树

机器学习（三）决策树

机器学习三决策树

机器学习(三) --决策树

《机器学习》------实验三（决策树）

机器学习笔记：决策树

机器学习之笔记-决策树

机器学习笔记4 －－决策树

机器学习实战笔记：决策树

机器学习实战笔记（决策树）

机器学习笔记二------决策树

机器学习笔记——决策树

机器学习基础笔记--决策树

机器学习笔记（六）决策树

机器学习算法笔记--------决策树

机器学习笔记5：决策树

机器学习笔记（五）---- 决策树

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

周排行

决策树的部分理解

STM32软件IIC的实现

RocketMQ原理解析-HA

vue-动态路由（路由的传参和接参）

利用python对Excel中的特定数据提取并写入新表

【Ubuntu】 Ubuntu16.04搭建NFS服务

Elasticsearch基础操作与对应的curl命令行，python对接实现

JVM数据存储结构 & Java的值传递和址传递

yum命令使用指南

java基础（一）：java语法基础

每日归档

更多

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)