深度学习框架keras使用—（3）MNIST数据集介绍 - 代码天地

深度学习框架keras使用—（3）MNIST数据集介绍

其他 2019-01-23 20:58:03 阅读次数: 0

MNIST数据集

MNIST数据集是一个手写体数据集，如图：

官网：Yann LeCun's website

http://yann.lecun.com/exdb/mnist/ , 下载下来的数据集被分成两部分：60000行的训练数据集（其中：60000 行的训练集分拆为 55000 行的训练集和 5000 行的验证集）和10000行的测试数据集。

其中，

Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)
Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)
Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000 个样本)
Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签)

每一张图片包含28*28个像素，在MNIST训练数据集中是一个形状为 [60000, 28, 28] 的张量。我们首先需要把数据集转成 [60000, 784]，然后才能放到网络中训练。第一个维度数字用来索引图片，第二个维度数字用来索引每张图片中的像素点。

一般我们还需要把图片中的数据归一化为0-1之间，如图

扫描二维码关注公众号，回复： 5039320 查看本文章

60000 行的训练数据集标签是介于 0 到 9 的数字，用来描述给定图片里表示的数字。称为 "one-hot vectors"。一个 one-hot 向量除了某一位的数字是 1 以外其余各维度数字都是 0。所以在此教程中，数字 n 将表示成一个只有在第 n 维度（从 0 开始）数字为 1 的 10 维向量。比如，标签 0 将表示成 ( [1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ] )。因此，其标签是一个 [60000, 10] 的数字矩阵。

总结：

1、MNIST数据集包含 55000 行训练集、5000 行验证集和10000 行测试集

2、每一张图片展开成一个 28 X 28 = 784 维的向量，展开的顺序可以随意的，只要保证每张图片的展开顺序一致即可

3、每一张图片的标签被初始化成一个 10 维的“one-hot”向量

猜你喜欢

转载自blog.csdn.net/zfjBIT/article/details/85837658

深度学习框架keras使用—（3）MNIST数据集介绍

深度学习框架keras使用—（5）MNIST数据集分类

深度学习之路：（一）Keras中mnist数据集测试

深度学习------keras,torch对mnist,cifar2,cifar3,cifar10数据集的读取总结

深度学习数据集——MNIST

Keras_深度学习_MNIST数据集手写数字识别之各种调参

[Keras深度学习浅尝]实战二·CNN实现Fashion MNIST 数据集分类

[Keras深度学习浅尝]实战一·DNN实现Fashion MNIST 数据集分类

[Keras深度学习浅尝]实战三·CNN实现Fashion MNIST 数据集分类

Keras深度学习记录1——从简单的mnist数据集开始

深度学习4：使用MNIST数据集（tensorflow）

【keras入门】使用 keras 训练 MNIST 数据集

（系列更新完毕）深度学习零基础使用 PyTorch 框架跑 MNIST 数据集的第二天：加载 MNIST 数据集

深度学习从零开始 —— 神经网络数学基础（一），学习Keras库的使用，神经网络简单流程，MNIST数据集使用

深度学习笔记（十二）--深度学习数据集MNIST、ImageNet、 COCO 、 VOC介绍

利用CNN对MNIST数据集识别(keras框架)

Python深度学习-MNIST数据集

keras加载mnist数据集

深度学习框架Keras介绍及实战

MNIST数据集的介绍以及下载使用

深度学习框架tensorflow学习与应用4（MNIST数据集分类的简单版本示例）

Python机器学习（七十三）Keras 加载MNIST数据集

使用keras 搭建Gans在Mnist数据集上训练总结

MNIST数据集介绍

MNIST 数据集介绍

深度学习04-keras实例iris数据集+模型保存调用及修改+在sklearn框架内使用Keras模型+交叉验证

【深度学习】3：BP神经网络与MNIST数据集实现手写数字识别

深度学习（1）：3-2MNIST数据集分类简单版本

深度学习03-keras实例介绍iris数据集+sklearn对比+模型结果分析

Windows系统下使用卷积神经网络实现手写数字识别(MNIST数据集/Pytorch深度学习框架)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)