Semantic Segmentation on Remotely Sensed Images Using an Enhanced Global Convolutional Network with Channel Attention and Domain Specific Transfer Learning

创新点:

1、在GCN(global convolutional network)基础上,把他的backbone替换成更多层的,使其适应中分辨率影像,resnet50,101,152

2、利用 channel attention 来挑选出最具有识别力的特征

3、迁移学习来解决数据稀缺的问题,用了不同分辨率训练好的数据

目标数据集:

landsat-8 和 ISPRS Vaihingen Challenge Dataset

语义分割现代技术:

1、global context(全局上下文信息):如 PSPNet 和 Deeplab v3 的金字塔池化和看空洞金字塔池化。但为了得到较好的效果,空洞卷积下采样了8次,费时费内存【16】

2、attention module(注意力模块):帮助我们只关注想要的信息,可以关注不同尺度的信息。本文用了 channel attention。【16,17】

3、refinement residual block(精细化残差块):每一步的所有特征图都要经过这个残差块。本文用的是 boundary refinement block(BR),第一部分是一个1*1的卷积层,输出通道统一成21层,第二部分加一个基础的残差块【15,16】

【15】 Peng, C.; Zhang, X.; Yu, G.; Luo, G.; Sun, J. Large kernel matters—Improve semantic segmentation by global
convolutional network. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition
(CVPR), Honolulu, HI, USA, 21–26 July 2017; pp. 1743–1751.
【16】 Yu, C.; Wang, J.; Peng, C.; Gao, C.; Yu, G.; Sang, N. Learning a Discriminative Feature Network for Semantic
Segmentation. arXiv 2018, arXiv:1804.09337.
【17】 Hu, J.; Shen, L.; Sun, G. Squeeze-and-excitation networks. arXiv 2017, arXiv:1709.01507.

数据预处理:

1、减去均值

2、随机水平翻转进行数据扩增

3、裁剪到512*512

训练参数:

初始学习率:0.004

权重衰减:0.00001

优化器:Adam

学习率衰减:poly 法,(1 - epoch / MaxEpoch)^0.9

epoch:50

batch-size:4

比较:

不同backbone,attention,transfer。迁移学习是两个数据集互相迁移,即 lc8 的训练好了算 isprs 的预训练权重,isprs 训练好的算 lc8 的预训练权重。

最后3个结合的效果最好

猜你喜欢

转载自www.cnblogs.com/tccbj/p/10812479.html