论文笔记：ShuffleNet v1

其他 2019-01-12 03:41:10 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/hongbin_xu/article/details/84304135

ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

ShuffleNet v1

1、四个问题

要解决什么问题？
- 为算力有限的嵌入式场景下专门设计一个高效的神经网络架构。
用了什么方法解决？
- 使用了两个新的操作：pointwise group convolution（组卷积）和channel shuffle。
- 根据这两个操作构建了ShuffleUnit，整个ShuffleNet都是由ShuffleUnit组成。
效果如何？
- 在ImageNet分类和MS COCO目标检测任务上取得了比其他轻量化模型更高的准确率，如MobileNet v1。
- 在ARM设备上，ShuffleNet的速度比AlexNet快了13倍。
还存在什么问题？
- 超参数如组卷积的组数以及通道压缩比率等需要根据实际情况决定，不同任务下需要自行调整。
- 网络实时性并不能单纯以浮点计算量来衡量，还存在memory access cost(MAC)等因素的干扰，并不能仅仅根据计算量就认为ShuffleNet是最快的。

2、论文概述

2.1、简介

作者发现，一些state-of-the-art的模型架构，如Xception、ResNeXt等，使用在小型网络模型中效率都比较低。这是因为使用大量的 $1 \times 1$ 卷积会消耗大量计算资源。为此，提出了pointwise group convolution来减少计算复杂度。
使用组卷积也会带来一些副作用，因为组卷积切断了组内通道与组外通道之间的联系，仅仅能从组内通道提取特征信息。为此，论文中又提出了 channel shuffle，来帮助信息在各通道之间流通。

2.2、相关工作

高效模型设计：
- GoogLeNet
- SqueezeNet
- ResNet
- SENet
- NASNet
组卷积（group convolution）：
- 最初由AlexNet提出，应用在2块GPU上并行处理。
- Xception中提出了深度可分离卷积（depthwise separable convolution）。
- MobileNet中也使用到了深度可分离卷积。
Channel Shuffle
- 此前的文献中较少提及channel shuffle操作。
模型加速
- 目标是再保证模型准确率的前提下尽可能加速前向推理过程。
- 常见方法:
  - 网络剪枝。
  - 量化和分解。
  - 知识蒸馏。

2.3、Channel Shuffle for Group Convolutions

在小型网络中，逐点卷积（pointwise convolution）不仅会占用较多计算资源并且还会让通道之间具有过多复杂的约束，这会显著地降低网络性能。在较大的模型中使用pointwise convolution也许相对好一些，然而小模型并不需要过多复杂的约束，否则容易导致模型难以收敛，并且容易陷入过拟合。
一个解决办法是：通道间稀疏连接（channel sparse connections）。使用组卷积可以一定程度上解决这个问题。
但是，使用组卷积也会带来副作用：信息只会在组内流通，组间不会有信息交互。为此，还需要使用channel shuffle来解决信息不流通的问题。

在这里插入图片描述

channel shuffle操作：
1. 假设一个卷积层上有 $g$ 组，每组有 $n$ 个通道，最后输出就有 $g \times n$ 个通道。
2. reshape成 $(g, n)$ 。
3. 转置成 $(n, g)$ 。
4. 展开（flatten），再分成 $g$ 组，作为下一层的输入。

2.4、Shuffle Unit

在这里插入图片描述

图(a)是残差卷积模块，标准 $3 \times 3$ 卷积转换为深度可分离卷积与 $1 \times 1$ 卷积的组合。中间加上BN和ReLU，构成基本单元。
图(b)是Shuffle Unit，将图(a)中的第一个 $1 \times 1$ 卷积替换成 $1 \times 1$ 组卷积（GConv）和channel shuffle组成的单元。
图©是用于降采样的Shuffle Unit，深度可分离卷积的步长改为2，为了适配主分支的feature map，在shortcut上加上了步长也为2的平均池化（AVG Pool $3 \times 3$ ）。
虽然深度可分离卷积可以减少计算量和参数量，但在低功耗设备上，与密集的操作相比，计算/存储访问的效率更差。故在ShuffleNet上只在bottleneck上有使用深度可分离卷积，尽可能的减少开销。

2.5、网络架构

在这里插入图片描述

2.6、实验

Pointwise Group Convolutions
- 从结果来看，有组卷积的一致比没有组卷积(g=1)的效果要好。注意组卷积可获得更多通道间的信息，我们假设性能提高受益于更多的feature map通道数，这也有助于我们对更多信息进行编码。并且，较小的模型的feature map通道也更少，这意味着能更多地从增加feature map上获益。

在这里插入图片描述

Channel Shuffle vs. No Shuffle

在这里插入图片描述

Comparison with Other Structure Units

在这里插入图片描述

Comparison with MobileNets and Other Frameworks

在这里插入图片描述

在这里插入图片描述

Generalization Ability
- 在MS COCO目标检测任务上测试ShuffleNet的泛化和迁移学习能力，以Faster RCNN为例：

在这里插入图片描述

Actual Speedup Evaluation

在这里插入图片描述

3、参考资料

猜你喜欢

转载自blog.csdn.net/hongbin_xu/article/details/84304135

论文笔记：ShuffleNet v1

ShuffleNet V1, ShuffleNet V2论文笔记

论文阅读笔记---ShuffleNet V1

论文笔记：ShuffleNet v2

YOLO v1论文笔记

论文笔记：Inception v1

图像分类模型：ShuffleNet V1阅读笔记

Yolo v1 笔记

论文阅读笔记：MobileNet v1

【YOLO学习笔记】之YOLO v1 论文笔记1（超详细：翻译+理解）

论文(1) YOLO v1

【YOLO学习笔记】之YOLO v1 论文笔记2（超详细：翻译+理解）

[论文笔记] ShuffleNet

【CNN】ShuffleNet系列（V1,V2）

YOLO v1论文理解

YOLO v1论文详解

GooleNet －Incepetion V1 学习笔记

硬件设计笔记v1

yolo v1笔记

mobilenet v1笔记

YOLO V1学习笔记

ShuffleNet V1 对花数据集训练

【论文学习笔记004】YOLO V1

第八课：ShuffleNet v1、ShuffleNet v2学习

YOLO v1论文翻译和解读

Resnet V1论文阅读和代码解析

MobileNet V1论文阅读和代码解析

【YOLO系列】YOLO V1 论文精读与学习总结

深度学习论文精读[10]：Deeplab v1

论文分享 | 轻量级网络之mobilenet v1

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)