在这里插入图片描述

多年来，手写体数学识别一直是研究热点，也是图像处理与识别领域中的研究课题之一。由于手写体数字的随意性很大，例如，笔画的粗细、字体的大小等都直接影响到字符的正确识别，所以手写体数字识别是一个很有挑战性的课题。

在过去的数十年中，研究者们提出了许多的识别方法,取得了较大的成果。手写体数字识别实用性很强，在大规模数据统计，如人口普查、财务、税务、邮件分拣等应用领域中都有广阔的应用前景。

本文是手写数字识别系统，采用深度学习的方法，在Matlab的guide上开发出GUI，能够对MNIST数据集进行预处理、CNN训练等操作，测试集的识别率接近100%。

00 目录

1 设计要求
2 程序目录说明
3 MNIST数据集介绍及处理
4 AlexNet网络修改
5 系统设计
6 系统实现
7 源码获取
8 展望

01 设计要求

本课题要求实现一个手写数字识别系统，选择一种手写字符识别的方法以实现能够对质量较好的字符图像进行识别的功能，利用MINIST数据集进行测试，要求测试准确度高。

02 程序目录说明

本文的GUI界面部分来自于作者的人脸识别系统，所以GUI名称是face_recog没有改动。
在这里插入图片描述

03 MNIST数据集介绍及处理

3.1 MNIST数据集介绍

对于手写数字识别，常用的数据集就是MNIST手写数字数据集，在这里插入图片描述

包含0~9这10个数字的手写图片，每个数字都由6万幅训练图像和1万幅测试图像构成，每一张都是28×28（像素）的黑白图像，MNIST数据图像如下，

在这里插入图片描述

3.2 将MNIST转换为图像数据库

了解了MNIST数据库后，需要利用这个数据库，这部分参考了斯坦福大学Andrew Ng教授的课件，通过loadMNISTImages.m和loadMNISTLabels.m两个文件读取mnist数据集。
loadMNISTImages.m
在这里插入图片描述

loadMNISTLabels.m
在这里插入图片描述

通过以上语句，能够将MNIST数据集转换为matlab里的图像矩阵在这里插入图片描述

而后再对这些数据进行如下的批处理
在这里插入图片描述

即可将图像矩阵转化为文件夹中分好类的图像库了，至此对于MNIST图形库的预处理已经结束。
在这里插入图片描述

04 AlexNet网络修改

AlexNet是经典的深度CNN结构，由著名学者Hinton和他的学生Alex Krizhevsky 设计，在2010年的ImageNet LSVRC-2010上，AlexNet在给包含有1000种类别的共120万张高分辨率图片的分类任务中，在测试集上的top-1和top-5错误率为37.5%和17.0%（top-5 错误率：即对一张图像预测5个类别，只要有一个和人工标注类别相同就算对，否则算错。同理top-1对一张图像只预测1个类别），在ImageNet LSVRC-2012的比赛中，取得了top-5错误率为15.3%的成绩，以远超亚军的成绩取得冠军，并一度掀起了深度学习的热潮。这里选择AlexNet进行修改，将其应用于本次的手写数字识别中。

在命令行中输入alexnet(‘Weights’,‘none’)即可查看AleNet网络的结构
在这里插入图片描述