Python实现计算信息增益的香农熵 - 代码天地

Python实现计算信息增益的香农熵

其他 2018-11-07 06:17:04 阅读次数: 0

版权声明：学习交流为主，未经博主同意禁止转载，禁止用于商用。 https://blog.csdn.net/u012965373/article/details/83117940

香农熵公式：

# -*- coding:utf-8 -*-
import math
__author__ = 'yangxin'

"""
一条信息的信息量大小和它的不确定性有直接的关系。比如说，我们要搞清楚一件非常非常不确定的事，或是我们一无所知的事情，
就需要了解大量的信息。相反，如果我们对某件事已经有了较多的了解，我们不需要太多的信息就能把它搞清楚。
所以，从这个角度，我们可以认为，信息量的度量就等于不确定性的多少。

"""


class ShannonEntropy(object):

    # 计算给定数据集的香农墒的函数
    def calc_shannon_ent(self, data_set):
        # 求list的长度，表示计算参与训练的数据量
        num_entries = len(data_set)
        # 计算分类标签label出现的次数
        label_counts = {}
        # the number of unique elements and their occurance
        for featVec in data_set:
            # 将当前实例的标签存储，即每一行数据的最后一个数据代表的是标签
            current_label = featVec[-1]
            # 为所有可能的分类创建字典，如果当前的健值不存在，则扩展字典并将当前健值加入
            if current_label not in label_counts.keys():
                label_counts[current_label] = 0
                label_counts[current_label] += 1
        # 对于label标签的占比，求出label标签的香农墒
        shannon_ent = 0.0
        for key in label_counts:
            # 使所有类标签的发生频率计算类别出现的概率
            prob = float(label_counts[key]) / num_entries
            shannon_ent -= prob * math.log(prob, 2)
        return shannon_ent

猜你喜欢

转载自blog.csdn.net/u012965373/article/details/83117940

Python实现计算信息增益的香农熵

Unorder 值的信息熵增益计算

熵、信息增益、信息增益比

【机器学习】信息量、香农熵、信息增益（增加例子，方便理解）

聊聊香农的信息熵

熵条件熵信息增益

熵——信息增益

信息增益与熵

熵与信息增益

信息熵和信息增益的简单理解与计算

信息熵、信息增益与信息增益率

信息熵、信息增益和信息增益比

信息熵和香农定理

熵、信息增益、信息增益率

决策树算法——熵与信息增益（Python3实现）

对信息熵，信息增益的研究

【机器学习（三）】机器学习中：信息熵，信息增益，信息增益比，原理，案例，代码实现。

信息熵，条件熵，信息增益与信息增益比

信息增益=信息熵-条件熵

Python实现——决策树实例(离散数据/香农熵)

机器学习：信息熵，基尼系数，条件熵，条件基尼系数，信息增益，信息增益比，基尼增益，决策树代码实现（一）

机器学习--信息信息熵信息增益

python详细步骤计算信息增益

python 信息熵的计算代码

Python计算信息熵代码

python计算图像信息熵

计算给定数据集的香农熵

随机森林信息&熵&信息增益

机器学习信息熵与信息增益

香农熵

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)