机器学习sklearn之决策树的实现 - 代码天地

机器学习sklearn之决策树的实现

企业开发 2018-11-27 18:10:49 阅读次数: 0

机器学习sklearn之决策树的实现

实现决策树的应用分为三步：
准备数据：即将数据读取为数据（x），标签格式（y）
拟合数据：导出sklearn模型，调用模型，生成dot文件
可视化数据：对模型利用Graphviz（数据可视化软件）进行可视化

导入一些sklearn的库以及csv

from sklearn.feature_extraction import DictVectorizer
import csv
from sklearn import tree
from sklearn import preprocessing
from sklearn.externals.six import StringIO

准备数据集
在这里插入图片描述

# Read in the csv file and put features into list of dict and list of class label
allElectronicsData = open(r'C:\Users\Administrator.SKY-20180518VHY\Desktop\代码与素材\代码与素材(1)\01DTree\sales_data.csv', 'r+')#读取csv数据
reader = csv.reader(allElectronicsData)#按行读取内容
headers = next(reader)#打印出为title那行

print(headers)

featureList = []#装feature
labelList = []#装类别

for row in reader:
    labelList.append(row[len(row)-1])
    rowDict = {}
    for i in range(1, len(row)-1):
        rowDict[headers[i]] = row[i]
    featureList.append(rowDict)

print(featureList)

# Vetorize features可以将字典中转化为0，1
vec = DictVectorizer()
dummyX = vec.fit_transform(featureList) .toarray()

print("dummyX: " + str(dummyX))
print(vec.get_feature_names())

print("labelList: " + str(labelList))

# vectorize class labels
lb = preprocessing.LabelBinarizer()
dummyY = lb.fit_transform(labelList)
print("dummyY: " + str(dummyY))

拟合数据集

# Using decision tree for classification
# clf = tree.DecisionTreeClassifier()
clf = tree.DecisionTreeClassifier(criterion='entropy')#clf分类器，id3为信息差，，默认不是id3
clf = clf.fit(dummyX, dummyY)#建模，我们的特征值和列
print("clf: " + str(clf))

可视化模型

# Visualize model
with open("allElectronicInformationGainOri.dot", 'w') as f:
    f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(), out_file=f)

在这里插入图片描述

对数据进行预测

oneRowX = dummyX[0, :]
print("oneRowX: " + str(oneRowX))

newRowX = oneRowX
newRowX[0] = 1
newRowX[2] = 0
print("newRowX: " + str(newRowX))

predictedY = clf.predict(newRowX)
print("predictedY: " + str(predictedY))

猜你喜欢

转载自blog.csdn.net/weixin_40123108/article/details/84502781

机器学习sklearn之决策树的实现

机器学习之决策树在sklearn中的实现

机器学习sklearn之决策树

【机器学习之决策树】决策树原理介绍及代码实现sklearn

机器学习实践（十）—sklearn之决策树

机器学习之决策树原理和sklearn实践

[机器学习python实践(4)]Sklearn实现决策树

机器学习笔记——分类决策树的Sklearn实现

机器学习决策树的Sklearn的实现（隐形眼镜镜片决策树实现）

pyhon 机器学习 sklearn 决策树

自学机器学习之sklearn实现决策树和随机森林及其参数的解释

决策树之 sklearn 实现

sklearn库学习之决策树

sklearn机器学习库(一)sklearn中的决策树

机器学习每日一练之决策树python原理及其基于sklearn代码实现

sklearn之决策树

sklearn实现决策树

机器学习入门之决策树（python实现）

【机器学习】【决策树】算法之python实现

机器学习之决策树原理及实现(python)

机器学习之决策树----python实现

机器学习之--决策树递归算法实现

机器学习实战之决策树(python实现)

机器学习算法之决策树原理与实现

机器学习sklearn中决策树模型参数释义

机器学习实战sklearn 构建决策树

机器学习sklearn（6）决策树分类

机器学习：决策树（二）——sklearn决策树调参

周志华《机器学习》第四章决策树-调用sklearn.tree实现

机器学习算法[4]--决策树原理详解及sklearn实现

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)