论文笔记| A Network Structure to Explicitly Reduce Confusion Errors in Semantic Segmentation

在这里插入图片描述

Abstract

文章认为部分类别之间由于视觉特征相似、网络feature map分辨率过小或者由于数据不均衡等原因,会使模型对这些类别感到confused。为了区分这些confusing classes,文章从网络结构设计(Discriminative Confusing Groups)和loss(Improved Cross-Entropy Loss)设计两方面做出了改进。

Discriminative Confusing Groups

其实这里可以看成是共享encoder的模型融合,将容易混淆的类别单独做loss之后进行Fusion,例如下图是cityscape的分组
在这里插入图片描述

分类的依据是不同类别之间的混淆矩阵:
在这里插入图片描述

Improved Cross-Entropy Loss

将cross entropy loss进行了类似于reweight的改进
改进前:
在这里插入图片描述

改进后:
在这里插入图片描述

实验

使用不同loss及网络结构的实验结果(cityscape)
在这里插入图片描述

结果还是挺不错的
这里在推荐几个关于softmax 不错的文章:

https://mp.weixin.qq.com/s?__biz=MzA3Mjk0OTgyMg==&mid=2651123524&idx=1&sn=0546ceca3d88e2ff1e66fbecc99bd6a7

https://zhuanlan.zhihu.com/p/45014864

猜你喜欢

转载自blog.csdn.net/bea_tree/article/details/83003806