MNIST数据集的组成
MNIST数据集包含了6w张图片作为训练数据,1w图片作为测试数据。在MNIST数据集中,每一张图片都代表了0~9中的一个数字,图片的大小都是28×28,且数字都会出现在图片的正中间。
数据集包含了四个文件
t10k-images-idx3-ubyte.gz | 测试数据图片 |
t10k-labels-idx1-ubyte.gz | 测试数据答案 |
train-images-idx3-ubyte.gz | 训练数据图片 |
train-labels-idx1-ubyte.gz | 训练数答案 |
每张图片的784个像素点组成长度为784的一维数组,作为输入特征
[0. 0. 0. ...... 0.38 0.45 0.64 .... 0. 0. 0. ]
图片的标签以一个一维数组的形式给出,每个元素表示对应分类出现的概率,比如数字“6”的标签
[0. 0. 0. 0. 0. 0. 1. 0. 0. 0. ]
查看MINIST
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('./data/',one_hot=True)
print("train data size:",mnist.train.num_examples)
print("validation data size:",mnist.validation.num_examples)
print("test data size:",mnist.test.num_examples)
t_lables0 = mnist.train.labels[1] #返回标签
t_iamge0 = mnist.train.images[1] #返回数据
t_iamge0.resize(28,28) #将784个元素的标签转换为28*28
print('t_lables0: ',t_lables0) #查看标签
运行结果:
Extracting ./data/train-images-idx3-ubyte.gz
Extracting ./data/train-labels-idx1-ubyte.gz
Extracting ./data/t10k-images-idx3-ubyte.gz
Extracting ./data/t10k-labels-idx1-ubyte.gz
train data size: 55000
validation data size: 5000
test data size: 10000
t_lables0: [0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]
查看t_iamge0,如下图
通过查看到的标签,可以看出,存放的就是手写数字“3”
扫描二维码关注公众号,回复:
5594819 查看本文章