一只菜鸡的决策树入门（二） - 代码天地

一只菜鸡的决策树入门（二）

企业开发 2018-07-28 05:10:00 阅读次数: 0

前期准备的基础理论，熵的计算，按照给定特征划分数据集，找出划分数据集的最优特征，但有些时候，数据集处理了所有属性，不过得到的类标签依然不是唯一的，书上说用之前KNN里面涉及的频次统计方法，遵从少数服从多数给该叶子节点分类，

import operator

def majorKind(dataList):
    majorFeat = {}
    for featVec in dataList.keys():
        if majorFeat[featVec] not in majorFeat:
            majorFeat[featVec] = 0
        majorFeat[featVec] += 1
    sortedMajorFeat = sorted(majorFeat.items(),key=operator.itemgetter(1),reverse=True)
    return sortedMajorFeat[0][0]

把这些肥料组合一下，开始种树：

def createMytree(dataSet,Labels):
    classList = [example[-1] for example in dataSet] #判断待分类数据集是否为同一类
    if len(dataSet) == classList.count(classList[0]):
        return classList[0]
    if len(dataSet[0]) == 1: #判断是否已无其他属性可分类
        return majorKind(classList) #选取频次最高的类标签最为该叶子节点的分类
    bestFeat = findbestfeature(dataSet) #划分数据集的最优特征
    bestFeatLabel = Labels[bestFeat]
    myTree = {bestFeatLabel:{}}
    del(Labels[bestFeat])
    subfeat = [example[bestFeat] for example in dataSet] #选取最优分类的属性做之后的分类特征
    uniqfeat = set(subfeat)
    for value in uniqfeat: #根据特征连续划分，得到的值插入myTree中
        subLabels = Labels[:]
        myTree[bestFeatLabel][value] = createMytree(splitdataset(dataSet,bestFeat,value),
                                                    subLabels)
    return Mytree

一脸懵逼，哎

猜你喜欢

转载自blog.csdn.net/Oldog_1991/article/details/81236728

一只菜鸡的决策树入门（二）

一只菜鸡的KNN入门

一只菜鸡的半年技术博客之路

[一只菜鸡][是条咸鱼][智障日常]

一只找不到工作的大四的菜鸡的菜鸡背景

一只鸡的情怀与梦想

来自一只菜狗的介绍

机器学习入门-决策树（一）

（二）决策树

决策树（二）

决策树（二）

决策树(二)

决策树（一）

决策树（一）

决策树(一)

【机器学习入门一】决策树及ID3决策树的python实现

决策树简介与入门

决策树（二）关于的决策树的一些思考

决策树详解（二）

决策树算法(二)

决策树算法（二）

决策树模型（二）

决策树（二）决策树回归

决策树(二)：分类决策树

机器学习（决策树二）——简述决策树

决策树原理（一）

决策树应用（一）

决策树系列（一）

决策树算法(一)

决策树算法(一）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)