论文笔记：Inception v1

其他 2018-10-30 17:42:38 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/hongbin_xu/article/details/83280821

原文：Going Deeper with Convolutions

Inception v1

1、四个问题

要解决什么问题？
- 提高模型的性能，在ILSVRC14比赛中取得领先的效果。
- 最直接的提高网络性能方法有两种：增加网络的深度（网络的层数）和增加网络的宽度（每层的神经元数）。这样的做法有如下两个缺点待改进：
  - 构建更大的网络也意味着会有更多的参数，这也会让网络更容易过拟合。
  - 同时也会需要更多的计算资源。
用了什么方法解决？
- 作者认为解决前面提到的那两个问题的根本方法是将全连接层，甚至是卷积层都替换为稀疏连接。
- 但是使用稀疏连接会浪费大量的计算资源。如果要有更高的计算性能，需要使用较为密集的矩阵运算。
- 因此，作者的想法是寻找一种方法，既能保持网络结构的稀疏性，又能利用密集矩阵的高计算性能。
- 大量文献表明可以将稀疏矩阵聚类为密集矩阵来提高计算性能，作者依此提出了Inception结构。
效果如何？
- 在ImageNet2014获得分类任务第一名，力压VGG。
- 将Inception迁移到其他视觉任务上也可以取得state-of-the-art的效果。
还存在什么问题？
- Inception主要是为计算机视觉任务设计的，迁移到其他领域不一定有效。
- Inception v1现在也算比较老的网络，主要借鉴它的思想（要用还是会选择Inception v3/v4的）。

2、论文概述

2.1、结构细节

Inception的主要思想是：设计一个结构，这个结构可以使用密集的成分来近似模拟一个局部稀疏的卷积神经网络结构。

在这里插入图片描述

对Inception模块的说明：
1. 采用几个不同的卷积核意味着具有不同大小的感受野，最后拼接在一起就意味着不同尺度特征的融合。
2. 采用 $1 \times 1$ 、 $3 \times 3$ 和 $5 \times 5$ 的卷积核的目的是为了方便后面对齐。
  - 假设卷积的步长 $stride = 1$ ，那么分别设定 $padding = 0/1/2$ ，那么卷积后可以直接得到相同维度的特征图，可以直接拼接在一起。
3. 作者提到，pooling对于如今许多卷积神经网络的成功都有不可或缺的作用，所以他也在Inception内嵌入了 $3 \times 3$ 的max pooling。
4. 网络越到后面，特征也越抽象。因为要将这些抽象特征进一步组合起来提取更高维的特征，网络不能只关注小范围内的特征信息了，所以需要让感受野大一些，看到更多的抽象信息。因此， $3 \times 3$ 和 $5 \times 5$ 卷积的比例要增加。
Inception模块还存在一个巨大的问题：那就是使用 $5 \times 5$ 卷积会带来大量的计算量。
所以作者又借鉴了Network in Network论文中的方法，使用 $1 \times 1$ 卷积来降维，减少计算量。改进结构如下图：

在这里插入图片描述

2.2、GoogleNet结构

在这里插入图片描述

GoogleNet结构说明：
1. 采用Inception模块堆叠而成。
2. 基于Network in Netw论文中的思想，在最后使用了average pooling来代替展开为全连接层的形式。实验也证明这样可以提高top-1准确率大概0.6%。
3. 最后加的那个全连接层主要是为了便于大家将网络用于其他的数据集finetune。
4. 网络中使用了dropout防止过拟合。
5. 网络中还额外增加了两个辅助的softmax层。主要作用是，避免梯度消失，帮助梯度的传导。实际测试模型的时候，会将这两个softmax去除。

3、参考资料

猜你喜欢

转载自blog.csdn.net/hongbin_xu/article/details/83280821

论文笔记：Inception v1

YOLO v1论文笔记

论文笔记：ShuffleNet v1

Inception v1

GoogLeNet（Inception V1）

Inception v2_batch normalization 论文笔记

inception-v1,v2,v3,v4----论文笔记

Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning 论文笔记

《Inception V3-Rethinking the Inception Architecture for Computer Vision》论文笔记

『Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning』论文笔记

[深度学习]Inception Net （V1-V4）系列论文笔记

[论文笔记] Inception V1-V4 系列以及 Xception

Yolo v1 笔记

论文阅读笔记：MobileNet v1

论文阅读笔记---ShuffleNet V1

论文阅读笔记四十二：Going deeper with convolutions (Inception V1 CVPR2014 )

ShuffleNet V1, ShuffleNet V2论文笔记

【YOLO学习笔记】之YOLO v1 论文笔记1（超详细：翻译+理解）

Inception v1 / GoogLeNet文章复现

GoogLeNet Inception v1详解

GoogLeNet（Inception V1）总结

关于inception-v1,v2,v3,v4----的论文笔记和代码大全

论文(1) YOLO v1

【YOLO学习笔记】之YOLO v1 论文笔记2（超详细：翻译+理解）

Inception v1 v2 v3

YOLO v1论文理解

YOLO v1论文详解

谷歌系列 :Inception v1到v4

GoogLeNet（从Inception v1到v4的演进）

GooleNet －Incepetion V1 学习笔记

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)