Context Encoding for Semantic Segmentation - 代码天地

Context Encoding for Semantic Segmentation

其他 2018-05-07 17:12:28 阅读次数: 4

1、Introduction

作者提出是不是捕捉语义信息等价于扩大感受野？
传统的encoder(BoW,VLAD)可以编码全局特征统计十分方便
一个encoding层将字典学习和残差编码都融合到一个网络里面，作者通过扩展encoding层来捕获全局的特征统计

2、contribution

第一是设计SEloss，不想pixelwise的损失，SEloss损失对于大目标和小目标施以相同的权重，网络对于小目标是有提升的
通过一个编码层，编码整体语义信息，选择class-dependent features，例如降低车辆出现在屋内的概率
同步BN，和memory-efficient的编码层

3、

首先作者利用编码层来获得特征统计来获得全局的global信息，为了更好地利用全局语义信息，用chanel-wise attention来选择class-dependent的特征图。编码层学习到了一个语义信息的字典，输出具有丰富语义信息的残差编码器

Input feature: CXWXH —> $x = \{x_1,x_2,...,x_N\},N = H \times W$
Inherent codebook: $D=\{d_1,d_2,...,d_k\}$
Scaling factors: $S=\{s_1,s_2,...,s_k\}$
最后会输出k个残差编码， $e_k = \sum_{i=1}^{N}e_{ik}$

这样做的目的是什么呢？
通过将图像的HXW个C维特征，每一个都与语义词 $d_k$ 做差，然后和所有语义词做差的结果相加进行归一化，获得一个像素位置相对于某个语义词的信息 $e_{ik}$ ，然后将这N个结果求和加在一块获得最终的 $e_k$ ，获得整张图像相对于第k个语义词的信息。
这里写图片描述 , $r_{ik}=x_i - d_k$
$e_k$ 是C维的，最后将k个 $e_k$ 融合到一起，这里没有用concat，一方面concat包含了顺序信息，另一方面用加的方法节省了显存。这里加起来的含义是获得整张图像相对于K个语义词的全部信息
，最后的e也是c维的

然后利用产生的e来产生通道权重，来一个channel-wise的attention
利用e再加一个全连接构成一个SEloss,标签的产生直接看该幅图内有哪些类，对应位置置1

整体网络框架如图

最后作者的k选择的是32
这里写图片描述

分别在stage 3,4设计了两个SE-loss,同时作者探讨了K的影响，k=0相当于global pooling

4、实验略。

猜你喜欢

转载自blog.csdn.net/u013548568/article/details/80223804

Context Encoding for Semantic Segmentation

【原】Context Encoding for Semantic Segmentation

语义分割--(EncNet)Context Encoding for Semantic Segmentation

Context Encoding for Semantic Segmentation 论文准备

《18.Context Encoding for Semantic Segmentation》

[论文笔记] Context Encoding for Semantic Segmentation

《Context Encoding for Semantic Segmentation》论文笔记

Context Encoding for Semantic Segmentation-CVPR2018【论文理解】

Semantic Segmentation---EncNet：Context Encoding for Semantic Segmentation（论文解读十八）

Context Encoding for Semantic Segmentation----用于语义分割的上下文编码

Semantic Segmentation---Adaptive Pyramid Context Network for Semantic Segmentation（论文解读十七）

CGNet: A Light-weight Context Guided Network for Semantic Segmentation

Learning to Predict Context-adaptive Convolution for Semantic Segmentation

Semantic Segmentation

【Semantic Segmentation】Segmentation综述

论文学习笔记（六） CGNet: A Light-weight Context Guided Network for Semantic Segmentation

图像语义分割论文解读（二）：Adaptive Pyramid Context Network for Semantic Segmentation

Learning to Predict Context-adaptive Convolution for Semantic Segmentation || ECCV2020

Semantic Segmentation与Instance Segmentation的区别

semantic segmentation 和instance segmentation

Instance Segmentation 和 Semantic Segmentation

classification、part segmentation、semantic segmentation、instance segmentation

《Understanding Convolution for Semantic Segmentation》

Semantic Segmentation Papers(1)

semantic segmentation——FCN

Semantic Segmentation with custom dataset

Understanding Convolution for Semantic Segmentation

Details on "Semantic Soft Segmentation"

OCR semantic segmentation

Semantic Segmentation：Jaccard index

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)