MNIST Training

其他 2018-05-17 13:00:54 阅读次数: 2

http://blog.csdn.net/u013508213/article/details/53401655

MNIST Training

MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字，其中数字的范围从0到9。

MNIST是ML界的’hello world’，这个比喻还挺有意思的。

MNIST Data

MNIST数据集有四个文件：

train-images-idx3-ubyte.gz：训练集图片 - 55000 张训练图片，5000 张验证图片。
train-labels-idx1-ubyte.gz：训练集图片对应的数字标签。
t10k-images-idx3-ubyte.gz：测试集图片 - 10000 张图片。
t10k-labels-idx1-ubyte.gz：测试集图片对应的数字标签。

这些文件本身并没有使用标准的图片格式存储。在下面代码中extract_images()和extract_labels()函数可以手动解压他们。

图片数据将被解压成2维的tensor：[image index, pixel index] 其中每一项表示某一图片中特定像素的强度值。”image index”代表数据集中图片的编号，从0到数据集的上限值。”pixel index”代表该图片中像素点的个数, 从0到图片的像素上限值。

以train-*开头的文件中包括60000个样本，其中分割出55000个样本作为训练集，其余的5000个样本作为验证集。因为所有数据集中28x28像素的灰度图片的尺寸为784，所以训练集输出的tensor格式为[55000, 784]。

数字标签数据被解压成1维的tensor：[image index]，它定义了每个样本数值的类别分类。对于训练集的标签来说，这个数据规模就是：[55000]。

解压重构图片和标签数据之后，会得到如下数据集对象：

data_sets.train：55000 组图片和标签，用于训练。
data_sets.validation：5000 组图片和标签，用于迭代验证训练的准确性。
data_sets.test：10000 组图片和标签, 用于最终测试训练的准确性。

调用以下代码中的read_data_sets()函数，将会返回一个DataSet实例，其中包含了以上三个数据集。

函数DataSet.next_batch()是用于获取以batch_size为大小的一个元组，其中包含了一组图片和标签，该元组会被用于当前的TensorFlow运算会话中。

这里tensorflow版本不同导致的该函数的参数形式的区别：

resized_image = tf.image.resize_images(img_data_jpg,28,28, method=0)

猜你喜欢

转载自blog.csdn.net/x2017x/article/details/78388945

MNIST Training

MNIST

Python 教程之创建您自己的用于多类分类的人工神经网络Galaxy Image Training Data星系图像训练数据集和MNIST 数据集

Maven training

Training for LCA

Training for 分块

yolo training

Training 10352

Adversarial Training

Training a classifier

Summer training

军训(training)

Training MTCNN

acm training

Training: ASCII

training 2

First Training

MES training

personal training

Training & Certification

Rehabilitation Training

MNIST实战

cnn for mnist

lstm for mnist

MNIST介绍

Mnist相关

深入MNIST

读取 MNIST

mnist实例

mnist svm

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)