MNIST数据集介绍

MNIST数据集的组成

MNIST数据集包含了6w张图片作为训练数据,1w图片作为测试数据。在MNIST数据集中,每一张图片都代表了0~9中的一个数字,图片的大小都是28×28,且数字都会出现在图片的正中间。

数据集包含了四个文件

t10k-images-idx3-ubyte.gz 测试数据图片
t10k-labels-idx1-ubyte.gz 测试数据答案
train-images-idx3-ubyte.gz 训练数据图片
train-labels-idx1-ubyte.gz 训练数答案

每张图片的784个像素点组成长度为784的一维数组,作为输入特征

[0. 0. 0.  ......   0.38 0.45 0.64 ....    0. 0. 0. ]

图片的标签以一个一维数组的形式给出,每个元素表示对应分类出现的概率,比如数字“6”的标签

[0.  0.  0.  0.  0.  0.  1.  0.  0.  0. ] 

查看MINIST

from tensorflow.examples.tutorials.mnist import  input_data
mnist = input_data.read_data_sets('./data/',one_hot=True)

print("train data size:",mnist.train.num_examples)
print("validation data size:",mnist.validation.num_examples)
print("test data size:",mnist.test.num_examples)

t_lables0 = mnist.train.labels[1] #返回标签
t_iamge0 = mnist.train.images[1] #返回数据

t_iamge0.resize(28,28) #将784个元素的标签转换为28*28
print('t_lables0: ',t_lables0) #查看标签

运行结果:

Extracting ./data/train-images-idx3-ubyte.gz
Extracting ./data/train-labels-idx1-ubyte.gz
Extracting ./data/t10k-images-idx3-ubyte.gz
Extracting ./data/t10k-labels-idx1-ubyte.gz
train data size: 55000
validation data size: 5000
test data size: 10000
t_lables0:  [0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]

查看t_iamge0,如下图

通过查看到的标签,可以看出,存放的就是手写数字“3”

扫描二维码关注公众号,回复: 5594819 查看本文章

猜你喜欢

转载自blog.csdn.net/plSong_CSDN/article/details/87950630
今日推荐