机器学习实战===决策树熵的实现解释 - 代码天地

机器学习实战===决策树熵的实现解释

其他 2018-06-15 05:08:05 阅读次数: 3

机器学习实战是ML的经典读物，作者用Python实现了机器学习的经典算法，这里对大家在网上问的比较多的，熵的实现进行注解。也为了自己回头梳理。熵在一定程度代表了时间的不确定性

from  math import log
import operator
#创建一个数据集合，以列表形式，集合元素同样是列表，元素最后一项是标签，
def createDataSet():
    dataSet=[[1,1,'yes'],
             [1,1,'yes'],
             [1,0,'no'],
             [0,1,'no'],
             [0,1,'no']]
    #一个标签列表
    labels=['no surfacing','flippers']
    #创建数据集返回集合，和标签集合
    return dataSet,labels


def calcShannonEnt(dataSet):
    #获得数据集长度，也就是数据集有多少记录，为计算概率的
    numEntries=len(dataSet)
    #创建一个标签计数的字典集合，其中以键值对为元素。初始为空
    labelCounts={}
    #遍历数据集合，获得集合中的每一个元素列表
    for featVec in dataSet:
        #取得列表最后一个标签值，yes no  作为当前标签
        currentlabel=featVec[-1]
        #如果标签集合没有这个label就将此key也就是label对应的value设置为0
        if currentlabel not in labelCounts.keys():
            labelCounts[currentlabel]=0
            #如果标签集合存在 这个label就计一次1   （此标签集合的形式是key是lebel value是出现次数）
        labelCounts[currentlabel]+=1
        #熵的初始化
        shannonEnt=0.0
        #获得标签集合的每一个标签
    for key in labelCounts:
        #获得标签的概率 ，numEntries为原始集合的长度
        prob=float(labelCounts[key])/numEntries
        #熵的计算公式
        shannonEnt -= prob * log(prob,2)
    return shannonEnt
def splitDataSet(dataSet,axis,value):

猜你喜欢

转载自blog.csdn.net/baidu_31481511/article/details/80584618

机器学习实战===决策树熵的实现解释

机器学习实战-决策树实战

机器学习实战决策树的java实现

机器学习算法及实战——决策树代码实现（三）

python3实现决策树（机器学习实战）

机器学习实战---决策树自编程实现（python）

机器学习实战之决策树(python实现)

机器学习实战——决策树（二）

机器学习实战——决策树（一）

机器学习实战决策树算法

《机器学习实战》——决策树

《机器学习实战》——决策树（二）

《机器学习实战》3：决策树

[机器学习实战]决策树

机器学习实战-决策树

机器学习实战------决策树

机器学习实战——决策树

机器学习实战——决策树代码

机器学习实战决策树

机器学习实战——决策树（代码）

机器学习实战笔记：决策树

机器学习实战（2）——决策树

机器学习：决策树算法实战

机器学习实战笔记（决策树）

机器学习实战决策树

机器学习实战之决策树

机器学习实战--决策树

机器学习实战---决策树

机器学习实战（2）-决策树

机器学习实战-决策树-画图

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)