决策树 ID3 - 代码天地

决策树 ID3

其他 2018-07-25 02:44:17 阅读次数: 0

1.选取最优特征
··classList=[example[-1] for example in dataSet]  # 类别
··if classList.count(classList[0])==len(classList):
··    return classList[0]
··if len(dataSet[0])==1:
··   return majorityCnt(classList)
··bestFeat=chooseBestFeatureToSplit(dataSet) #选择最优特征

def chooseBestFeatureToSplit(dataSet):  # 选择最优的分类特征
    numFeatures = len(dataSet[0])-1
    baseEntropy = calcShannonEnt(dataSet)  # 原始的熵
    bestInfoGain = 0
    bestFeature = -1
    for i in range(numFeatures):
        featList = [example[i] for example in dataSet]
        uniqueVals = set(featList)
        newEntropy = 0
        for value in uniqueVals:
            subDataSet = splitDataSet(dataSet,i,value)
            prob =len(subDataSet)/float(len(dataSet))
            newEntropy +=prob*calcShannonEnt(subDataSet)  # 按特征分类后的熵
        infoGain = baseEntropy - newEntropy  # 原始熵与按特征分类后的熵的差值
        if (infoGain>bestInfoGain):   # 若按某特征划分后，熵值减少的最大，则次特征为最优分类特征
            bestInfoGain=infoGain
            bestFeature = i
    return bestFeature

即有该特征的某一值的条路/总条数 * 该具体特征的香农熵

2. 然后分叉构建子树

featValues=[example[bestFeat] for example in dataSet]
uniqueVals=set(featValues)
for value in uniqueVals:
    subLabels=labels[:]
    myTree[bestFeatLabel][value]=createTree(splitDataSet\
                        (dataSet,bestFeat,value),subLabels)

类似于第一次下图天气为最佳特征，然后有三value，分别构造子树。

猜你喜欢

转载自blog.csdn.net/nathan1025/article/details/81144334

【python】决策树ID3

决策树ID3算法

决策树算法——ID3

ID3决策树的生成

决策树 ID3

决策树算法：ID3

决策树——ID3算法

决策树之ID3

决策树算法--ID3

决策树ID3

决策树——ID3

ID3决策树

决策树与ID3算法

决策树-ID3

3.决策树ID3算法原理

ID3决策树(python3)

python3 || 决策树 ID3算法

决策树ID3算法原理

python决策树 math库ID3算法

决策树ID3算法详解

决策树：ID3算法与实现

机器学习—决策树（ID3）

决策树之ID3算法

机器学习-决策树（ID3）

python 使用Id3算法实现决策树

ID3决策树程序实现

决策树---ID3算法的理解

决策树ID3 算法python实现

决策树之系列一ID3

利用决策树 ID3 算法进行预测

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)