信息熵和信息增益的简单理解与计算 - 代码天地

信息熵和信息增益的简单理解与计算

其他 2020-01-22 21:33:48 阅读次数: 0

信息熵：

信息熵的概念很简单，熵在信息论中代表随机变量不确定的度量。

熵越大，数据的不确定性越高。
熵越小，数据的不确定性越低。

信息熵的公式：

下面的公式就是香农提出的信息熵的公式：
$H = - \sum_{i=1}^k p_i log(p_i)$
解释一下：

假如一组数据有k类信息，那么每一个信息所占的比例就是 $p_i$ 。比如鸢尾花数据包含三种鸢尾花的数据，那么每种鸢尾花所占的比例就是 $\frac 1 3$ ，那么 $p_1$ 、 $p_2$ 、 $p_3$ 就分别为 $\frac 1 3$ 。
因为 $p_i$ 只可能是小于1的，所以 $log(p_i)$ 始终是负数。所以需要在公式最前面加负号，让整个熵的值大于0。

信息增益：

信息增益在决策树算法中是用来选择特征的指标，信息增益越大，则这个特征的选择性越好，在概率中定义为：待分类的集合的熵和选定某个特征的条件熵之差。

在这里插入图片描述

参考文档：https://www.devtalking.com/articles/machine-learning-15/

发布了145 篇原创文章 · 获赞 34 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43207025/article/details/102650618

信息熵和信息增益的简单理解与计算

信息熵、信息增益和信息增益比

熵、信息增益、信息增益比

Unorder 值的信息熵增益计算

Python实现计算信息增益的香农熵

信息熵、信息增益与信息增益率

熵——信息增益

信息增益与熵

熵与信息增益

熵条件熵信息增益

求训练集的熵和信息增益

对信息熵，信息增益的研究

熵、信息增益、信息增益率

信息熵，条件熵，信息增益与信息增益比

信息增益=信息熵-条件熵

决策树中信息增益计算和代码理解

决策树信息熵和信息增益的概念

机器学习--信息信息熵信息增益

随机森林信息&熵&信息增益

机器学习信息熵与信息增益

信息熵、信息增益、条件熵、互信息

B-概率论-熵和信息增益

条件熵和信息增益代码+结果展示

信息熵和条件熵的计算

信息增益的计算

信息量，信息熵，交叉熵，KL散度和互信息（信息增益）- 机器学习

【机器学习】信息量，信息熵，交叉熵，KL散度和互信息（信息增益）

决策树（信息熵、信息增益、信息增益率、基尼值和基尼指数、剪枝）

AI机器学习-信息熵，条件熵，信息增益

AI机器学习-信息熵、条件熵、信息增益

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)