【文章阅读】【代码复现】BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation 【code】

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/github_36923418/article/details/84869762

                       

文章归类:图像分割,网络结构创新,实时

主体思想

1、希望利用网络结构的改造,来弥补“感受野”受限的不足,因此BiSeNet的网络结构拥有两条主线“Spatial Path (SP)” 和 “Context Path (CP)” 

2、设计了特征整合的新模块“Feature Fusion Module (FFM)” 以及 用于attention加权的模块“Attention Refinement Module (ARM)” 来提升feature maps的一个性能,让特征更具有代表性。

3、速度快(网络结构小巧)

网络整体结构

                                                         

“Spatial Path (SP)”:这个模块主要适用于保留更多的空间信息的,每一层都是“conv+bn+relu”每次都会进行一次降采样“stride=2”或者利用pooling,(本文选择了在卷积操作的时候stride=2进行降采样)。这部分网络是没有pretrain的,当然初始化的时候可以自行各自骚操作。

“Context Path (CP)”:主体是一个Xception39/res18/res101等,进行特征提取,得到3个不同大层输出的不同尺度的feature maps以及最后的一个globe pooling得到的一个最高语义信息。

其他模块分析

                                                         

“Attention Refinement Module (ARM)” :这个模块的思想有点类似SE模块,提取这一层feature maps的高级语义特征对feature maps进行加权。

                                                 

“Feature Fusion Module (FFM)” :用于整合来自CP这path的特征以及SP这个path的两边的特征。

其他细节

    

文章的训练策略和大多数的图像分割文章采用的策略是保持一致的,“多尺度”、“翻转”、“剪裁”等,以及“学习率策略”和“网络学习参数的设定”。

实验结果

从文中的实验结果来看,还是不错的,主要是速度快,105FPS

文章复现代码:稍后更新。。。

猜你喜欢

转载自blog.csdn.net/github_36923418/article/details/84869762