python mnist数据导入以及处理 - 代码天地

python mnist数据导入以及处理

企业开发 2018-07-15 20:13:36 阅读次数: 0

在使用机器学习以及深度学习的时，常用的示例是使用mnist数据进行分类，本文简要的实现下mnis数据的导入以及处理，问题来源stackoverflow。

直接上代码了，注释很清楚了：

import cPickle
import gzip
import numpy as np
import matplotlib.pyplot as plt

def load_data():
    path = '../../data/mnist.pkl.gz'
    f = gzip.open(path, 'rb')
    training_data, validation_data, test_data = cPickle.load(f)
    f.close()

    X_train, y_train = training_data[0], training_data[1]
    print X_train.shape, y_train.shape
    # (50000L, 784L) (50000L,)

    # get the first image and it's label
    img1_arr, img1_label = X_train[0], y_train[0]
    print img1_arr.shape, img1_label
    # (784L,) , 5

    # reshape first image(1 D vector) to 2D dimension image
    img1_2d = np.reshape(img1_arr, (28, 28))
    # show it
    plt.subplot(111)
    plt.imshow(img1_2d, cmap=plt.get_cmap('gray'))
    plt.show()

输出结果如下：

这里写图片描述

对label进行向量化：

def vectorized_result(label):
    e = np.zeros((10, 1))
    e[label] = 1.0
    return e

print vectorized_result(img1_label)
# output as below:
[[ 0.]
 [ 0.]
 [ 0.]
 [ 0.]
 [ 0.]
 [ 1.]
 [ 0.]
 [ 0.]
 [ 0.]
 [ 0.]]

我们也可以使用简单的for循环来将上述的784为输入向量转化为28*28维向量给CNN使用：

def load_data_v2():
    path = '../../data/mnist.pkl.gz'
    f = gzip.open(path, 'rb')
    training_data, validation_data, test_data = cPickle.load(f)
    f.close()

    X_train, y_train = training_data[0], training_data[1]
    print X_train.shape, y_train.shape
    # (50000L, 784L) (50000L,)

    X_train = np.array([np.reshape(item, (28, 28)) for item in X_train])
    y_train = np.array([vectorized_result(item) for item in y_train])

    print X_train.shape, y_train.shape
    # (50000L, 28L, 28L) (50000L, 10L, 1L)

来源自己的stack overflow回答。

猜你喜欢

转载自blog.csdn.net/haluoluo211/article/details/81042529

python mnist数据导入以及处理

使用python处理MNIST数据集

Python解析MNIST数据集

Python读取MNIST数据集

mnist数据的预测结果以及批量处理

python笔记6:数据处理之导入数据

Python数据预处理-导入Excel数据存为数组

基于jupyter notebook的python编程-----MNIST数据集的的定义及相关处理学习

Python数据处理之（十四）Pandas 导入导出

导入mnist数据

导入mnist数据集

python 继承以及导入类

Python数据处理——绘制函数图形以及数据拟合

图像处理基本库的学习笔记1--MNIST数据集，Python环境搭建，数据仓库，OPENCV

python 数据导入 pandas

Python导入数据

python逻辑回归分类MNIST数据集

python3 加载MNIST数据集

python中本地加载MNIST数据集

python中Keras下载mnist数据集

Python深度学习-MNIST数据集

Python路径处理及模块导入

【MNIST/Python】手写体数字训练/测试数据集(图片格式)下载及分割预处理

吴裕雄 python 神经网络——TensorFlow 实现LeNet-5模型处理MNIST手写数据集

【python学习】HDF数据的处理以及Pandas使用

python之文件的读写，模块的导入，异常处理，json数据处理

【Python处理EXCEL】基础操作篇：在Python中导入EXCEL数据

python3将json对象存入Redis以及数据的导入导出

python 导入同级目录文件、上级目录文件以及下级目录数据集和模块包

python之pandas数据导入

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

周排行

mongodb 下载与安装与初步使用

20190530

iOS录制回放神器AutoTouch使用介绍

同心圆猜数字游戏

mamp pro安装redis扩展各个步骤截图

windows10下安装docker报错：error during connect

跨域授权 Federated Identity Pattern

js时间比较大小

pandas to_csv()使用方法

从JDK源码角度看Byte

每日归档

更多

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)