深度学习理论篇之 ( 十三) -- LetNet-5之风起云涌 - 代码天地

深度学习理论篇之 ( 十三) -- LetNet-5之风起云涌

企业开发 2023-05-05 17:27:05 阅读次数: 0

科普知识

对于深度学习或机器学习模型而言，我们不仅要求它对训练数据集有很好的拟合（训练误差），同时也希望它可以对未知数据集（测试集）有很好的拟合结果（泛化能力），所产生的测试误差被称为泛化误差。度量泛化能力的好坏，最直观的表现就是模型的过拟合（overfitting）和欠拟合（underfitting）。

回顾

犹记深度学习理论篇最近的一篇文章分享了降维之池化，从那以后我们就开始了深度学习实战TensorFlow的分享，按照之前的进度，分享完池化后差不多卷积神经网络的基础模块就结束了，于是让大家走进实战去了解整个神经网络的搭建和训练，如此便可让大家从基础到整体，从底层到上层有了一个总体轮廓。从今天起，我们正式回归理论篇的分享，之前也说过深度学习的理论一直在发展，因此，理论篇和实战篇可能永远都不会结束，基础模块分享完之后，我们首先从卷积神经网络的一些经典论文开始分享，然后去进行实战操作，愿各位不虚此行。

一、LetNet-5

本期文章，我们分享经典卷积神经网络的开山之作LetNet-5网络,该神经网络架构由LeCun在1998年提出，用于识别手写数字。那会估计都没几个知道有深度学习这东西的时候，人家就已经提出来了，而且效果较传统方法非常之不错，从那以后，各路大神横空出世，各路卷积神经网络风起云涌，逐渐演变成了今天的万物皆AI的现状。

LetNet-5 论文名：Gradient-Based Learning Applied to Document Recognition。

放几张论文图：

1.LetNet-5 网络结构图

以上就是LetNet-5的网络结构图，从图中我们可以看到输入的是一张手写的英文字母A,随后经过进了卷积层-下采样-卷积层-下采样-全连接层-全连接层，最终输出该输入图片属于每个数字的概率，实际测试的时候取最大概率值的索引值为最终预测值。

最终识别效果图如下所示：

网络解析

1.输入层：一张原始图像，其shape为1*32*32，代表是灰度图（单通道），图像大小为32*32.

2.卷积层1：

输入：1*32*32

卷积核大小：5*5

卷积核个数：6

步长：默认为1

输出特征图大小：32-5+1 =28 ，即 28*28

输出特征图shape：6*28*28 代表6个28*28的特征图，6课理解为28*28大小的特征图有6个通道。

3.下采样层1：

采样方式：平均池化

输入：6*28*28

采样区域：2*2

步长：默认为1

输出特征图大小：28/2 = 14，即14*14

输出特征图shape:6*14*14

4.卷积层2：

输入：6*14*14

卷积核大小：5*5

卷积核个数：16

步长：1

输出特征图大小：14-5+1=10,即10*10

输出特征图shape:16*10*10

5.下采样2：

采样方式：平均池化

输入：16*10*10

采样区域：2*2

步长：默认为1

输出特征图大小：10/2 = 5，即5*5

输出特征图shape:16*5*5

6.卷积层3：

输入：16*5*5

卷积核大小：5*5

卷积核个数：120

步长：1

输出特征图大小：5-5+1=1,即1*1

输出特征图shape:120*1*1

7.全连接层1：

输入：120*1*1等效于120

输出神经元：84

输出特征图shape:84

8.全连接层2：

输入：84

输出神经元：10

输出特征图shape:10

至此，一张图像经过LetNet-5网络后就变成了一个长度为10的向量。训练的时候，就会将这10个值传入到loss函数中计算当前的loss大小，随后进行反向传播。

在实际测试的时候，会将这十个值的向量经过一个softmax函数，得到每一个值的概率，值越大，概率越大，概率之和为1。

总结

LetNet-5是第一个真正意义上的卷积神经网络，它是当前神经网络的开山鼻祖，由于当时的计算机技术发展缓慢，其在涉及之初就考虑到了参数大小的影响，因此整个网络具有非常简洁，参数量小，训练速度快等优点。

结语

本期分享就到这里了，今天的知识很简单，主要分析了网路的构造和每一层的维度大小，理论讲完，就趁热打铁，下期文章，我们将会用TensorFlow进行实战，编写LetNet-5网络用语手写数字识别，敬请期待，学有余力的老铁们可以提前尝试哦。

周末愉快，下期再见！

过去的时光里，我们都做了啥：

编辑：玥怡居士|审核：小圈圈居士

往期推荐

01

深度学习理论篇之 ( 十二) -- 降维之池化

02

深度学习理论篇之 ( 十一) -- 卷积神经网络之风云盛世（三）

03

深度学习理论篇之 ( 十) -- 卷积神经网络之风云盛世（二）

扫码关注我们

IT进阶之旅

在看你就赞赞我

猜你喜欢

转载自blog.csdn.net/xyl666666/article/details/118886361

深度学习理论篇之 ( 十三) -- LetNet-5之风起云涌

深度学习实战篇之 ( 十二) -- TensorFlow之LetNet-5

风起云涌之UBTC

花书+吴恩达深度学习（十四）卷积神经网络 CNN 之经典案例（LetNet-5, AlexNet, VGG-16, ResNet, Inception Network）

解析：SaaS 2.0 时代之风起云涌

深度学习笔记——理论与推导之Reinforcement Learning（十三）

深度学习(十三) Adversarial Attack 理论部分

深度学习实战篇之 ( 十三) -- TensorFlow之AlexNet

深度学习理论基础5-感知机的局限性

【深度学习理论】(5) 图卷积神经网络 GCN

深度学习理论

深度学习（十三）

深度学习理论篇之 ( 十六) -- GoogLeNet之再探深度之谜

深度学习理论篇之 ( 十五) -- VGG之初探深度之谜

TP5学习（十三）：其他

深度学习理论篇之 ( 十七) -- ResNet之深之经典

深度学习理论篇之 ( 十八) -- 注意力机制之SENet

深度学习理论篇之 ( 十八) -- DenseNet之囊括万千

深度学习理论篇之 ( 十四) -- AlexNet之更上一楼

深度学习理论——Softmax

三十三、进程理论

机器学习理论基础学习5--- PCA

Nginx详解二十三：Nginx深度学习篇之Nginx+Lua开发环境搭建

十三、Redis之HyperLogLog

学习python第十三天，函数5 装饰器

JAVA学习笔记（十三）

学习五十三

学习六十三

CUDA学习笔记（十三）

（十三）集成学习

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)