LR Weka Mnist

Mnist

先贴一个介绍的很好的博客 https://blog.csdn.net/sysushui/article/details/53257185

mnist是一个手写体数字的数据集。上图是数据集的组成,分别为训练样本特征集、训练样本标签集、测试样本特征集、测试样本标签集。

训练样本有60000个,测试样本是10000个。

• 训练样本标签集

ubyte类型数据就是二进制流。

第0到第3字节:魔数(一个校验数,用来判断这个文件是不是MNIST里面的train-labels.idx1-ubyte文件)

第4到第7字节:样本容量数(这里就是60000)

从第8个字节开始每个字节代表了一个样本的标签(0到9之间的一个数值)

• 训练样本特征集

mnist图片集中,每张图片都有28*28=784个像素

第0到第3字节:魔数

第4到第7字节:样本容量数

第8到第11字节:表示每个图片的行数(28)

第12到第15字节:每个图片的列数(28)

从第16个字节开始是图片的像素值,每784个字节代表一幅图片

猜你喜欢

转载自www.cnblogs.com/yingying7/p/9647194.html
LR