论文:CSA-MSO3DCNN: Multiscale Octave 3D CNN with Channel and Spatial Attention for Hyperspectral Image Classification
1. Motivation
提出问题:由于高光谱图像存在空间信息冗余的情况,所以在用3D-CNN处理高光谱图像分类问题时会带来大量的参数。
如何解决:作者引入OctConv替代传统的卷积,能够有效减少空间冗余和增大感受野。
关于OctConv
2. Model Structure
-
Octave Convoltion
总体结构和OctConv原文相同,不同之处在上图红框。对于一个三层的OctConv,原文的最后一层是将低频信息转换为高频信息,然后和更新后的高频信息汇总输出;本文中是将高频信息转换为低频信息,和更新后的低频信息汇总输出。个人认为作者的目的是得到尺寸更小的feature map,从而进一步减少参数和增大感受野。 -
Channel and Spatial Attention
又是熟悉的attention !!! 关于注意力机制就不多说了,之前的一篇博文已经总结了:https://blog.csdn.net/zxdd2018/article/details/104325588 -
总体结构
3. Datasets
- Indian Pines
- Pavia University
- Grss_dfc_2013(NSF-funded Center for Airborne Laser Map- ping (NCALM))
- Grss_dfc_2014( 2014 IEEE GRSS Data Fusion Contest)
数据集划分方式:不按百分比,每类选取相同数量
4. Parameters
- ratio(OctConv): 0 ~ 1
- patchsize:14×14 18×18 22×22 26×26 30×30
- dropout:0.2 0.4 0.5 0.6 0.8
- training sample
总结
论文主要创新点:引入OctConv代替普通卷积