Paper Reading -- CSA-MSO3DCNN: Multiscale Octave 3D CNN with Channel and Spatial Attention

论文:CSA-MSO3DCNN: Multiscale Octave 3D CNN with Channel and Spatial Attention for Hyperspectral Image Classification

1. Motivation

提出问题:由于高光谱图像存在空间信息冗余的情况,所以在用3D-CNN处理高光谱图像分类问题时会带来大量的参数。
如何解决:作者引入OctConv替代传统的卷积,能够有效减少空间冗余和增大感受野。
关于OctConv

2. Model Structure

  • Octave Convoltion
    在这里插入图片描述
    总体结构和OctConv原文相同,不同之处在上图红框。对于一个三层的OctConv,原文的最后一层是将低频信息转换为高频信息,然后和更新后的高频信息汇总输出;本文中是将高频信息转换为低频信息,和更新后的低频信息汇总输出。个人认为作者的目的是得到尺寸更小的feature map,从而进一步减少参数和增大感受野。

  • Channel and Spatial Attention
    在这里插入图片描述
    又是熟悉的attention !!! 关于注意力机制就不多说了,之前的一篇博文已经总结了:https://blog.csdn.net/zxdd2018/article/details/104325588

  • 总体结构
    在这里插入图片描述

3. Datasets

  • Indian Pines
  • Pavia University
  • Grss_dfc_2013(NSF-funded Center for Airborne Laser Map- ping (NCALM))
  • Grss_dfc_2014( 2014 IEEE GRSS Data Fusion Contest)

数据集划分方式:不按百分比,每类选取相同数量

4. Parameters

  • ratio(OctConv): 0 ~ 1
  • patchsize:14×14 18×18 22×22 26×26 30×30
  • dropout:0.2 0.4 0.5 0.6 0.8
  • training sample

总结

论文主要创新点:引入OctConv代替普通卷积

发布了12 篇原创文章 · 获赞 21 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/zxdd2018/article/details/104491195
今日推荐