决策树 C4.5 - 代码天地

决策树 C4.5

其他 2018-07-25 02:44:02 阅读次数: 0

相对ID3,改为判断ratio
for value in uniqueVals:     #计算每种划分方式的信息熵
    subdataset=splitdataset(dataset,i,value)
    p=len(subdataset)/float(len(dataset))
    newEnt+=p*jisuanEnt(subdataset)
    IV=IV-p*log(p,2)
infoGain=baseEnt-newEnt
if (IV == 0): # fix the overflow bug
    continue
infoGain_ratio = infoGain / IV                   #这个feature的infoGain_ratio

或者

 for value in uniqueVals:
            subDataSet = splitDataSet(dataSet, i, value)
            prob = len(subDataSet) / float(len(dataSet))
            newEntropy += prob *calcShannonEntOfFeature(subDataSet, -1)    #calc conditional entropy
 infoGain = baseEntropy - newEntropy
 iv = calcShannonEntOfFeature(dataSet, i)
 if(iv == 0):    #value of the feature is all same,infoGain and iv all equal 0, skip the feature
    continue
  infoGainRate = infoGain / iv

#calc shannon entropy of label or feature
def calcShannonEntOfFeature(dataSet, feat):
    numEntries = len(dataSet)
    labelCounts = {}
    for feaVec in dataSet:
        currentLabel = feaVec[feat]
        if currentLabel not in labelCounts:
            labelCounts[currentLabel] = 0
        labelCounts[currentLabel] += 1
    shannonEnt = 0.0
    for key in labelCounts:
        prob = float(labelCounts[key])/numEntries
        shannonEnt -= prob * log(prob, 2)
    return shannonEnt

猜你喜欢

转载自blog.csdn.net/nathan1025/article/details/81144997

【weka】决策树C4.5

决策树 C4.5

决策树算法：C4.5

决策树——C4.5

决策树C4.5

机器学习之决策树(C4.5算法)

决策树---C4.5算法的理解

机器学习之决策树二-C4.5

（七）决策树（ID3、C4.5）

决策树（ID3、C4.5、CART）

Java实现C4.5决策树

决策树之 C4.5 算法

决策树C4.5算法详解

决策树—ID3、C4.5、CART

决策树系列（四）——C4.5

机器学习模型-决策树(C4.5)

决策树之C4.5算法

分类算法 -- 决策树C4.5算法

决策树(ID3、C4.5、CART)

决策树与分类算法之C4.5

数据挖掘 -- C4.5决策树算法

02-22 决策树C4.5算法

决策树分类算法：C4.5算法

决策树（ID3、C4.5）

数据挖掘-分类-决策树-C4.5

CART与ID3、C4.5决策树

决策树算法-ID3、C4.5

机器学习-决策树-C4.5决策树

5-4 决策树 C4.5决策树的生成算法

决策树算法原理详解（ID3、C4.5、CART树）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)