【文章阅读】【代码复现】BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation 【code】

文章归类：图像分割，网络结构创新，实时

主体思想：

1、希望利用网络结构的改造，来弥补“感受野”受限的不足，因此BiSeNet的网络结构拥有两条主线“Spatial Path (SP)” 和 “Context Path (CP)”

2、设计了特征整合的新模块“Feature Fusion Module (FFM)” 以及用于attention加权的模块“Attention Refinement Module (ARM)” 来提升feature maps的一个性能，让特征更具有代表性。

3、速度快（网络结构小巧）

网络整体结构：

“Spatial Path (SP)”：这个模块主要适用于保留更多的空间信息的，每一层都是“conv+bn+relu”每次都会进行一次降采样“stride=2”或者利用pooling，（本文选择了在卷积操作的时候stride=2进行降采样）。这部分网络是没有pretrain的，当然初始化的时候可以自行各自骚操作。

“Context Path (CP)”：主体是一个Xception39/res18/res101等，进行特征提取，得到3个不同大层输出的不同尺度的feature maps以及最后的一个globe pooling得到的一个最高语义信息。

其他模块分析：

“Attention Refinement Module (ARM)” ：这个模块的思想有点类似SE模块，提取这一层feature maps的高级语义特征对feature maps进行加权。

“Feature Fusion Module (FFM)” ：用于整合来自CP这path的特征以及SP这个path的两边的特征。

其他细节：

文章的训练策略和大多数的图像分割文章采用的策略是保持一致的，“多尺度”、“翻转”、“剪裁”等，以及“学习率策略”和“网络学习参数的设定”。

实验结果：

从文中的实验结果来看，还是不错的，主要是速度快，105FPS

文章复现代码：稍后更新。。。

【文章阅读】【代码复现】BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation 【code】

猜你喜欢