关于cifar-10数据集读取问题

数据集下载后是特定格式,需要编写函数进行读取。读取后是dict格式,有4个键及其对应的若干值,如何准确读取并修改图像维度,使用reshape会发现数据错乱。

每个文件中数据存储格式为dict字典,键值为b’data’的为图片数据,是一个10000 * 3072(32 * 32 * 3)的numpy向量,10000表示图片张数,3072中前1024个表示Red通道数据,中间1024个表示Green通道数据,最后1024个表示Blue通道数据,数据范围是0-255,表示像素点灰度。键值为b’labels’表示对应的标签,是一个长度为10000的 list,数据范围是0-9,分别表示10个类别。

另外要说明的是卷积滤波器卷积的是32 * 32 * 3格式的数据,32 * 32代表图片一个通道格式,3表示RGB 3个通道,然而依据其数据表示格式,在 reshape 3072维度的向量的时候必须首先reshape成3 * 32 * 32格式的向量,否则会破坏图片原本格式,怎么办呢,转置!类似于矩阵的转置,三维向量也有转置,tensorflow提供transpose方法对三维向量作转置。

猜你喜欢

转载自blog.csdn.net/weixin_41855385/article/details/84474721
今日推荐