SQUEEZENET：AlexNet-level Accuracy with 50X fewer parameters and 0.5MB model size - 代码天地

SQUEEZENET：AlexNet-level Accuracy with 50X fewer parameters and 0.5MB model size

其他 2018-11-17 03:27:41 阅读次数: 0

这是由UC Berkerley和Stanford研究人员一起完成的Squeezenet网络结构和设计思想。SqueezeNet设计目标是在保持精度（Alexnet）的情况下简化网络的复杂度。

1、设计原则：

尽量选择1*1卷积核来代替3*3卷积核，因为1*1的卷积核比3*3的卷积核参数少了9倍。
减少3*3卷积核的输入通道（input channels），因为卷积核参数为：（number of input channels）*（number of filters）*3*3
延迟下采样（downsample），前面的layers可以有更大的特征图，有利于提升模型的准确度。目前下采样一般采用strides>1的卷积或者pool layer。【下采样即缩小图像，目的是使图像符合现实区域的大小，生成对应图像的缩略图。】在AlexNet中，第一层的卷积是stride=4，直接下采样了4倍。在一般的CNN中，一般卷积层、池化层都会有下采样（stride>1），甚至在前面基层网络的下采样比例会比较大，这样会导致最后几层的神经元的激活映射区域减少。为了提高精度设计下采样延迟慢一点

【前两个策略是为了减少参数，而第三个策略是为了最大化精度】

2、SqueezeNet的网络结构

SqueezeNet网络基本但愿是采用了模块化的卷积，其称为Fire module。Fire模块主要包含两层卷积操作：一是采用了1x1卷积核的squeeze层；二是混合使用1x1和3x3卷积核的expand层。Fire模块的基本结构如下图。在squeeze层卷数记为 $s_{1*1}$ ，在expand层卷积数记为 $e_{1*1}$ 和 $e_{3*3}$ ，分别代表了1x1和3x3卷积核的数量。为了尽量减少3x3的输入通道，这里让 $s_{1*1<}e_{1*1}+e_{3*3}$ 。

Fire module

整个SqueezeNet网络就是由File module堆积起来的，SqueezeNet的整体结构如下图，左边是标准的SqueezeNet，其最开始是一个卷积层，后面是Fire module的堆积，值得注意的是其中穿插了stride=2的maxpool层，其主要作用的是下采样（downsample），并采用延迟的策略，尽量使前面层拥有较大的feature map。中间和右边的图分别是引入了不同“短路”机制的SqueezeNet，借鉴了resNet的结构：

3、具体的实现细节

在Fire模块中，expand层采用了混合卷积核1x1和3x3，stride=1，对于1x1，其输出的feature map与原始一样大， 3x3则padding=1，也会得到和原始一样大小的图。
Fire模块中所有卷积层的激活函数采用ReLU
Fire9层厚采用了dropout=0.5
SqueezeNet没有全连接层，而是采用了全局的avgpool（global average pool），即pool size和输入的feature map大小一致。
训练采用线性递减的学习速率，初始学习速率为0.04

SqueezeNet各层参数信息

结果的对比：

除了上面的工作，作者还探索了网络的设计空间，包括微观结构和宏观结构，微观结构包括各个卷积层的维度等设置，宏观结构比如引入ResNet的短路连接机制。

参考：https://zhuanlan.zhihu.com/p/31558773

猜你喜欢

转载自blog.csdn.net/github_37973614/article/details/81504353

SQUEEZENET：AlexNet-level Accuracy with 50X fewer parameters and 0.5MB model size

SqueezeNet：ALEXNET-LEVEL ACCURACY WITH 50X FEWER PARAMETERS AND ＜0.5MB MODEL SIZE

【SqueezeNet】《SqueezeNet：AlexNet-Level accuracy with 50× fewer parameters and 小于 0.5MB model size》

SqueezeNet:AlexNet-level Accuracy with 50x fewer parameters and less than 0.5Mb model size

【论文阅读】【ICLR 2017】SqueezeNet AlexNet-level accuracy with 50x fewer parameters and 0.5MB model size

论文阅读之SequeezeNet：AlexNet-level accuracy with 50x fewer parameters and<0.5MB model size

模型压缩经典论文SqueezeNet:AlexNet level accuracy with 50x fewer parameters and less 0.5MB model size论文详解

【CV】SqueezeNet：用于嵌入式设备的轻量化 CNN 压缩模型（0.5MB）

Illegal key size or default parameters

Pytorch中的model.named_parameters()和model.parameters()

pytorch中的model.named_parameters()与model.parameters()

Understanding Model Parameters in Machine Learning

Linsheng-Size Parameters Of Air Compressor

java 报错：Illegal key size or default parameters

[STAT-157] Building Model, parameters, initialization,

在pytorch中查看模型model参数parameters

java.security.InvalidKeyException: Illegal key size or default parameters

加密算法时报错:Illegal key size or default parameters

jdk8 Illegal key size or default parameters

微信退款 Illegal key size or default parameters

Caffe官方教程翻译（10）：Editing model parameters

nginx的50X错误与php-fpm配置的优化

pytorch使用torchvision0.2版本-SqueezeNet报错问题解决：Calculated output size: (5x0x0). Output size is too small

keras model.compile(loss='目标函数 ', optimizer='adam', metrics=['accuracy'])

错误：java.security.InvalidKeyException: Illegal key size or default parameters解决方法

AES加密时报java.security.InvalidKeyException: Illegal key size or default parameters异常

AES加密时抛出 java.security.InvalidKeyException:Illegal key size or default parameters 解决办法

Java开发AES 256算法时遇到 Illegal key size or default parameters的解决办法

java中的AES 256算法遇到 Illegal key size or default parameters错的解决办法

使用AES时出现 Illegal key size or default parameters 时的解决办法

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)