Paper Reading - Model系列 - ShuffleNet Chanel Attention

ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

Paper

更多可见计算机视觉-Paper&Code - 知乎

ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

Abstract

Channel Shuffle

深度可分离卷积 - Depthwise Separable Convolution

Experiment

Coding

Abstract

ShuffleNet由旷世提出主打轻量化网络，移动端部署，结合了Mobilenet的深度可分离卷积dwconv，ResNeXt的group卷积操作。主要有以下三点改进

channel shuffle
pointwise group convolutions
depthwise separable convolution

Channel Shuffle

一般卷积操作中那么每一个filter都要和所有的feature map做卷积，然后相加作为一个卷积的结果。

如图中的（a）如果引入group操作，这样每个filter不再需要和输入的全部feature map做卷积，而是和一个group中的feature map做卷积，这种操作可以大大减少计算量，且最早被AlexNet用来切分网络进行多卡训练。但是这也会导致每个group的输出channel仅仅来自输入channel的一小部分，学出来的特征会非常局限。且组卷积要谨慎使用，注意分组的数目同时注意避免网络碎片化

因此（b/c）中引入了channel shuffle，在进行下一次卷积前，将原先的group依次平均分配到下一个group中进行组合，这样GConv2的每一个group都能得到各个group的信息feature map，

Pointwise Group Convolutions

在ResNeXt中主要是对3*3的卷积做group操作，ShuffleNet中同样把group引入1*1卷积中

如图a是ResNet的bottleneck unit，把3*3替换为dwconv。图b加入channelshuffle以及1*1gconv。图c是增加了一个avgpooling，以及最后融合方式改为concat通道合并

深度可分离卷积 - Depthwise Separable Convolution

Depthwise Convolution完成后的Feature map数量与输入层的depth相同，没有有效的利用不同map在相同空间位置上的信息。因此需要增加Pointwise Convolution操作来将这些map进行组合生成新的Feature map，如图参数量 3 × 3 × 3 = 27