鸢尾花数据集的可视化

#TensorFlow实战

鸢尾花数据集的可视化化展示



前言

数据可视化展示能在实验中可视化展出实验结果,是基础部分


一、介绍

鸢尾花数据集是公开的数据集,可通过URL从TensorFlow的Keras连接下载。

二、步骤

1.引入库

代码如下(示例):

import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt

2.读入数据

代码如下(示例):

""" 下载数据集
下载路径: TRAIN_URL = "http://download.tensorflow.org/data/iris_training.csv"
          train_path = tf.keras.utils.get_file("iris_training.csv", TRAIN_URL)
"""
# 读入数据集pd.read_csv(filepath_or_buffer,header,names)  路径,列标题,自定义列标题names
COLUMN_NAMES = ['SepalLength', 'SepalWidth', 'PetalLength', 'PetalWidth', 'Species']
df_iris = pd.read_csv("C:/Users/lx/.keras/datasets/iris_training.csv",header=0, names=COLUMN_NAMES)
#head()读取前n行数据 tail()是读取后n行 describe()显示二维数据的统计信息
print(df_iris.head())

'''
dataframe的常用属性:ndim,size,shape
可直接转化为数组np.arry() 或者自带的方法:df.values or df.as_matrix()
'''
print(df_iris.ndim, df_iris.shape, df_iris.size)
# 全局设置中文属性,格式是黑体,设置坐标轴能够正常显示负数坐标轴
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

iris = np.array(df_iris)

'''鸢尾花数据集的可视化'''
plt.scatter(iris[:, 2], iris[:, 3],c=iris[:, 4], cmap='brg')
plt.title("鸢尾花数据集分类\n 蓝色--Setosa | 红色——Versicolor  |  绿色——Virginia")
plt.xlabel(COLUMN_NAMES[2])
plt.ylabel(COLUMN_NAMES[3])
plt.show()

#设置画布尺寸 4*4大图
fig = plt.figure('Iris Data', figsize=(15,15))
fig.suptitle("鸢尾花数据集分类\n 蓝色--Setosa | 红色——Versicolor  |  绿色——Virginia")

for i in range(4):
    for j in range(4):
        plt.subplot(4, 4, 4*i+(j + 1))
        if (i == j):
            plt.text(0.3, 0.4, COLUMN_NAMES[i], fontsize=15)
        else:
            plt.scatter(iris[:, j], iris[:, i], c=iris[:, 4], cmap='brg')

        if(i==0):
            plt.title(COLUMN_NAMES[j])
        if(j==0):
            plt.ylabel(COLUMN_NAMES[i])

plt.tight_layout(rect=[0,0,1,0.93])
plt.show()

结果:

单张鸢尾花数据集分类可视化
各个属性随机组合的可视化展示

Guess you like

Origin blog.csdn.net/weixin_51121822/article/details/121382573