shuffleNet V2 - 代码天地

shuffleNet V2

编程语言 2018-08-11 03:26:56 阅读次数: 0

论文出发点：旨在设计一个轻量级但是保证精度、速度的深度网络

分析当前：

1、直接用FLOP来衡量算力，不够准确。因为不同的网路，即使参数量相同（模型大小相同），但是模型速度还是存在差异。改为直接用速度（speed）来衡量

2、直接影响速度的因素，首先MAC，比如分组卷积，需要强大的算力对设备GPU是个挑战；其次并行度。

因此，设计网络需要考虑：speed和platform

同时提出4条设计准则：注意，这些设计准则是权衡了速度和精度的针对轻量型网络提出的准则。

1、同等通道可以最小化MAC（即：让c1 = c2），所以PW（1x1）卷积的升维降维就影响MAC

2、过多的分组卷积增大MAC（从公式看出，随着g的增大，MAC增大）

3、网络碎片会影响并行化（building block中的分支）

4、元组的操作开销是不可忽略的

基于这4条规则，论文设计了shufflenetV2轻量化网络结构，

轻量化网络：要在给定参数条件下，限制feature map的通道数，那如何在不增加参数量的前提下还能保证feature map的通道数呢？使用分组卷积和深度可分离卷积，但是这两个卷积方式都违背了设计准则。

因此，shufflenetv2提出了channel split, 将C通道的featur map分离成两branch（C1, C-C1），
其中一个branch直连（保留identity）
另一个branch连接三个具有同等输入输出通道的卷积，且一头一尾的两个1x1的卷积就是标准的卷积，不是分组卷积
最后，两个branch直接拼接。

相比， shufflenetv1，不再有元组操作（elt-wise add）

shufflenetV2主要结构如c,d图所示，

c图是同feature map尺寸的，有split, concact, shuffle
d图是降采样的，没有split，所以通道数翻倍,feature map大小缩倍

具体可视化后的building block如下图：第一个是D结构，第二个是C结构。

亲测，shuffleNetV2的参数量和算力是碾压式的小！但是训练的时候很占显存，因为网络很深，feature map很多。但是如果只是推理还是很值得一试。

猜你喜欢

转载自blog.csdn.net/liu1152239/article/details/81477753

shuffleNet V2

轻量化网络：ShuffleNet V2

ShuffleNet v2算法笔记

深度学习【57】ShuffleNet V2

论文笔记：ShuffleNet v2

ShuffleNet V2学习笔记

【CNN】ShuffleNet系列（V1,V2）

ShuffleNet V1, ShuffleNet V2论文笔记

第八课：ShuffleNet v1、ShuffleNet v2学习

【阅读】ShuffleNet和MobileNetv1, v2

ShuffleNet V2网络模型学习笔记

轻量化网络：ShuffleNet v2解析

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

基于视频学习ShuffleNet与V2的网络结构

ShuffleNet V2网络详解及复现

ShuffleNet V2 迁移学习对花数据集训练

ShuffleNet V2 （2018）读书笔记

ShuffleNet系列之ShuffleNet_v2

轻量级深度学习网络——ShuffleNet & ShuffleNet v2

ShuffleNet系列之ShuffleNet_v1

『计算机视觉』轻量级网络ShuffleNet_v1及v2

ShuffleNet V1/V2 | 轻量级深层神经网络

【网络结构设计】3、ShuffleNet 系列 | 从 V1 到 V2

shufflenet v1/v2的网络结构和实现代码总结(torch)

深度学习图像分类（十三）：ShuffleNet系列（V1,V2）

学习ECCV2018旷视新移动端ShuffleNet v2模型

【阅读笔记】《ShuffleNet V2: Practical guidelines for Efficient CNN Architecture Design》

【CV】ShuffleNet V2：高效 CNN 架构设计的实用指南

ShuffleNet V2：高效CNN架构设计实用指南

四、CNNs网络架构-深度可分离卷积（MobileNet v1、MobileNet v2、MobileNet v3、Xception、ShuffleNet v1、ShuffleNet v2）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)