CNN系列学习(一):LeNet-5

PDF下载
LeNet-5网络是由LeCun等人在1998年提出,用于解决手写数字识别,由于提出了卷积与池化这一概念,为后来卷积神经网络的发展奠定了基调。
网络结构如图:图片来自原文
可以看到,网络输入是一个一维的32x32大小的图片,通过5x5的卷积核,经过6个特征通道,输出的到28x28x6的feature maps,通过2x2的下采样池化后图片大小降至14x14x6,然后用5X5的卷积核卷积的同时再将6个特征通道再一次进行组合得到新的16个特征通道,如图:
第二个卷积层特征通道实现细节
之后再通过一个下采样,变为5x5x16之后,用5x5的卷积核进行全连接的映射,得到一维的120位参数(也可译为120维参数),然后经过两次全连接,映射到最后的一维10位参数,在识别出来的那位数字对应位数置为零。
下面再计算一下需要计算的参数值:
对于第一层卷积,卷积核为5x5,步长为一,特征通道为6,则神经元数量为28x28x6,每一个卷积核计算是会额外添加一个bias参数,则需要计算的参数数量为(5x5+1)x6x28x28,为122304个。
对于第一个池化层,是2x2的采样,也会有一个偏置,参数数量即为(22+1)61414=5880
同理,接下来的卷积层池化层对应的参数数量分别为151600与2000个。到全连接的那个卷积参数为84*(120+1)=10164个。最后一层为84x10=840个。

总结:
LeNet-5网络的最大贡献不在于实现了手写数字操作,而是提出了卷积-池化-全连接这种经典的网络连接结构,可以看到后来各种复杂的解决更深更难问题的网络都是这样的骨架上做的调整修改。

猜你喜欢

转载自blog.csdn.net/weixin_43292354/article/details/85231529