一、本篇介绍

篇名：基于卷积神经网络LeNet-5的车牌字符识别研究
作者：赵志宏，杨绍普，马增强
作者单位：北京交通大学机械与电子控制工程学院
发表在：系统仿真学报，2010年3日#二、本文主要内容（知识点）

二、本文主要内容（知识点）

1、概要

车牌识别系统主要包括三个部分：车牌定位、字符分割与字符识别。本篇论文主要研究字符识别。
字符识别方法大致可以分为两类：基于结构的方法和基于统计的方法。
基于结构的方法的优点是符合人的直觉，可以容易地处理局部变换，其主要缺点是抗噪声能力差。
基于统计的方法比较成熟，具有抗干扰、噪声的能力，识别性能好，识别速度快的优点，它的难点是特征提取，因此，在统计字符识别中，特征提取的质量是影响系统性能的关键因素。
卷积神经网络较一般神经网络在图像处理方面具有如下优点:(1)输入图像和网络的拓扑结构能很好的吻合；(2)特征提取和模式分类同时进行；(3)权值共享可以减少网络的训练参数，使神经网络结构变得更简单，适应性更强。

2、卷积神经网络介绍

卷积神经网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了广泛的应用。
卷积神经网络通过结合三个方法来实现识别位移、缩放和扭曲不变性：局域感受野、权值共享和次抽样。

1.卷积层

在卷积层，前一层的特征图与一个可学习的核进行卷积，卷积的结果经过激活函数后的输出形成这一层的特征图。每一个输出的特征图可能与前一层的几个特征图的卷积建立关系。一般地，卷积层的形式如式(1)所示：
这里写图片描述
其中，l代表层数，k是卷积核，Mj代表输入特征图的一个选择。每个输出图有一个偏置b。

2.次抽样层

一个次抽样层对输入进行抽样操作。如果输入的特征图为n个，则经过次抽样层后特征图的个数仍然为n，但是输出的特征图要变小(例如，变为原来的一半)。次抽样层的一般形式如式(2)所示：
这里写图片描述
其中，down(·)表示次抽样函数。次抽样函数一般是对该层输入图像的一个n×n大小的区域求和，因此，输出图像的大小是输入图像大小的1/n。每一个输出的特征图有自己的β和b。

3、LeNet-5介绍

输入图像要经过大小归一化，每一个神经元的输入来自于前一层的一个局部邻域，并被加上由一组权值决定的权重。提取的这些特征在下一层结合形成更高一级的特征。同一特征图的神经元共享相同的一组权值,次抽样层对上一层进行平均。
LeNet-5包括输入，由8层组成，每一层都包括可训练的参数(权值) ，其中C层是由卷积层神经元组成的网络层，S层是由次抽样层神经元组成的网络层。
第一层是输入层，是32×32的图像。
第二层，网络层C1是由6个特征图组成的卷积层。每个神经元与输入图像的一个5×5的邻域相连接，因此每个特征图的大小是28×28。
第三层，网络层S2是由6个大小为14×14的特征图组成的次抽样层，它是由C1层抽样得到。特征图的每个神经元与C1层的一个大小为2×2的邻域连接。
第四层，网络层C3是由16个大小为10×10的特征图组成的卷积层。特征图的每个神经元与S2网络层的若干个特征图的5×5的邻域连接。
第五层，网络层S4是由16个大小为5×5的特征图组成的次抽样层。特征图的每个神经元与C3层的一个2×2大小的邻域相连接。
第六层，网络层C5是由120个特征图组成的卷积层。每个神经元与S4网络层的所有特征图的5×5大小的邻域相连接。
第七层，网络层F6，包括84个神经元，与网络层C5进行全连接。
第八层，输出层有10个神经元，是由径向基函数单元(RBF)组成，输出层的每个神经元对应一个字符类别。
RBF单元的输出yi的计算方法如式(3)所示：
这里写图片描述

4、对LeNet-5的改进

改变C5层特征图的个数。
C5层特征图个数对车牌字符识别率有直接影响，随着C5层特征图个数的增加，车牌字符的识别率也有所提高。这说明，在类别数增加的情况下，增加C5层特征图的个数，可以提高LeNet-5卷积神经网络的分类能力。但当提高到一定程度后，再增加C5层特征图的数目，识别率将不再提高。

5、实验的数据集

车牌图像经过定位，字符分割后，存入车牌字符数据库，没有对车牌图像进行去噪处理。为了应用卷积神经网络LeNet-5，所有的车牌字符都归一化为32×32大小。
所用的车牌图像均由数码相机在实际环境中获取的分辨率为640×480的真实车牌图像，收集到实际车牌图像数据共650个，利用其中的字符分别建立训练数据集与测试数据集，训练数据集与测试数据集之间没有重叠。

6、实验结果分析

随着训练次数的增加，训练样本与测试样本的正确率都随着增加。并且当训练样本集的正确率达到100%后，继续训练，测试样本集的正确率仍然得到提高，基本不出现过训练的情况。这体现了卷积神经网络良好的性能。
识别错误的38个车牌字符或者是由于预处理效果不好(字符分割的效果不理想)，或者是由于噪声的影响(在字符的关键地方有很强的噪声)，还有部分是由于倾斜的影响(倾斜角度很大)。识别错误的字符，可以通过有效的预处理过程来进一步减少。另外，可以通过扩大训练字符集来进一步提高车牌字符识别的正确率。

扫描二维码关注公众号，回复： 4732057 查看本文章

三、具体创新

用CNN中的LeNet-5解决车牌字符识别问题，相比于传统的机器学习，使用CNN可以大幅度提高准确率和减低数据预处理的难度，传统的卷积神经网络LeNet-5的结构进行了改进，改进后的LeNet-5比传统的LeNet-5识别率有所提高。

四、心得感想

对CNN的学习，本文虽然和车型识别没关系，而且年份太早，但是本文的被引次数却非常的高，证明这是一篇质量非常高的论文。
本文从一个车牌字符识别的领域入手，通过对一个现有的LeNet-5网络的改进，提高了识别率。

五、专业词汇的学习

license plate character recognition 车牌字符识别

另：一些说明
1、本博客仅用于学习交流，欢迎大家瞧瞧看看，为了方便大家学习，相关论文请去知网等地方自行下载。
2、如果原作者认为侵权，请及时联系我，我的qq是244509154，邮箱是[email protected]，我会及时删除侵权文章。
3、我的文章大家如果觉得对您有帮助或者您喜欢，请您在转载的时候请注明来源，不管是我的还是其他原作者，我希望这些有用的文章的作者能被大家记住。
4、最后希望大家多多的交流，提高自己，从而对社会和自己创造更大的价值。

06《基于卷积神经网络LeNet-5的车牌字符识别研究》学习总结