基于Python实现的 “手写数字识别”代码复现

一、开发环境

开发语言 : python 3.6.13

使用框架：TensorFlow 2.5.0 + Keras 2.5.0

开发工具：PyCharm 2020.2.2 x64

此次复现的主要代码文件有：

simpleDemo.py

参考了书目《Python 深度学习》，是一个最简单的数字识别。

从 Kears 的 datasets 中导入 mnist, 并使用简单的隐藏层进行训练。
complexDemo.py

添加多层神经网络的较复杂数字之别。

从 Keras 的 datasets 中导入 mnist,并使用带有均值池化的卷积神经网络方法训练。
finalDemo.py

最终的数字识别。

为了验证算法的可行性以及最终的正确性，这里采用了 Kaggle 比赛中 Digit Recognizer 题目所提供的的 mnist 测试集 test.csv 和训练集 train.csv，并采用带有最大池化的卷积神经网络，以及避免过拟合的方法进行训练。
input 文件夹

存放从 finalDemo 中读取的文件，训练集 train.csv 和测试集 test.csv。
output 文件夹

存放 finalDemo.py 最终生成的 CSV 文件。

首先需要将二维的数据一维化

epochs=50

三个 Demo 均采用 50 个回合进行训练

test_loss, test_accuracy = network.evaluate(test_images, test_labels)

print("test_loss:", test_loss, "    test_accuracy:", test_accuracy)

采用 network.evaluate()评估函数输出测试集损失和测试集准确率，训练集损失以及训练集准确率。

simpleDemo.py

可以发现 simpleDemo 的预测准确性并不是很高，仅有 92% 左右。
complexDemo.py

预测准确性可以达到 99% 左右，但是仍然存在着过拟合的情况。
finalDemo.py

在 Kaggle 提供的测试集和训练集上训练效果较好，测试集上的准确性能够达到 99.55% 左右，最终在 Kaggle 上的效果也证明了此算法较好。