论文笔记：Fast Video Object Segmentation using the Global Context Module - 代码天地

论文笔记：Fast Video Object Segmentation using the Global Context Module

其他 2021-04-02 22:02:21 阅读次数: 0

这篇文章发表在ECCV2020上面，是基于STM的改进。简单回顾一下STM，这个算法模型综合利用了previous frames的信息，来帮助更好的预测分割mask，但存在的问题就是随着帧数的增加，由于需要把之前的帧信息存放到memory中，所以占用的内存以及计算成本会很高。虽然STM中给出了利用之前的某5帧的建议，但这样又不能对每一帧加以利用。

因此，本文提出的Global Context Module就是解决这一问题的，利用这一种固定尺寸的特征表示，不仅可以充分利用之前每一帧的信息，还能减少网络模型的空间和计算开销。

在这里插入图片描述
Encoder和Decoder与STM是一样的，但是对于Memoey和Query的key和value的处理是有区别的。STM是将Memory和Query的key先进行相似度计算，得到一个matching，随后将其与Memory的value相乘，再concat到Query的value上。而这篇文章处理思路与STM是有很大差别的，具体区别如下图：

在这里插入图片描述
本篇文章Memory的并不是看作 $H * W$ 个位置，每个位置是 $C_{M}$ 维度的vector；而是将其看作 $C_{M}$ 个 1维的特征图，进而可以把它当作若干个与value相关的权重矩阵，所以首先通过Memory的key和value计算当前帧的context matrix：
在这里插入图片描述

得到C以后，就可以进一步计算出全局的上下文特征：
在这里插入图片描述

在更新了global context feature以后，就可以进一步根据query计算出第t帧的distributed global features，这一步相当于把过去所有帧的一些region of interest和当前帧的query进行summarize。最后将D和query的value拼接起来，喂入decoder做mask的预测。

一些结果：

在这里插入图片描述

可见涨点不是太多，但是效率和内存的占用比STM高了非常多，因此这是一种非常不错的轻量级的算法模型。

猜你喜欢

转载自blog.csdn.net/jackzhang11/article/details/108671424

论文笔记：Fast Video Object Segmentation using the Global Context Module

论文笔记STM：Video Object Segmentation using Space-Time Memory Networks

论文笔记——RANet： Ranking Attention Network for Fast Video Object Segmentation

论文笔记——FEELVOS：Fast End-to-End Embedding Learning for Video Object Segmentation

【论文笔记】FEELVOS: Fast End-to-End Embedding Learning for Video Object Segmentation

论文笔记：Learning Video Object Segmentation from Unlabeled Videos

论文笔记——OSVOS：One-Shot Video Object Segmentation

Fast and accurate object detection in high resolution 4K and 8K video using GPUs 论文笔记

Video Object Segmentation using Space-Time Memory Networks论文理解

论文笔记：Fast Online Object Tracking and Segmentation: A Unifying Approach

论文笔记【1】：2018-[CVPR] MoNet: Deep Motion Exploitation for Video Object Segmentation

BubbleNets: Learning to Select the Guidance Frame in Video Object Segmentation by Deep Sorting Frames论文笔记

《SAT：State-Aware Tracker for Real-Time Video Object Segmentation》论文笔记

论文笔记——OnAVOS：Online Adaptation of Convolutional Neural Networks for Video Object Segmentation

[论文笔记] Context Encoding for Semantic Segmentation

《Context Encoding for Semantic Segmentation》论文笔记

ICCV 2017 《Online Video Object Detection using Association LSTM》论文笔记

论文：Fast Semantic Segmentation on Video Using Block Motion-Based Feature Interpolation

Online Adaptation of Convolutional Neural Networks for Video Object Segmentation论文阅读

MaskRNN Instance Level Video Object Segmentation 论文翻译

论文阅读--CVPR2018--video object segmentation--1

cvpr 2016 论文学习 Video object segmentation

论文阅读KMN：Kernelized Memory Network for Video Object Segmentation

Spatiotemporal CNN for Video Object Segmentation

2019论文阅读4:Fast and Accurate Online Video Object Segmentation via Tracking Parts

FEELVOS: Fast End-to-End Embedding Learning for Video Object Segmentation论文理解

Fast Video Object Segmentation by Reference-Guided Mask Propagation论文理解

RANet: Ranking Attention Network for Fast Video Object Segmentation 论文学习

Fast Video Object Segmentation by Reference-Guided Mask Propagation 论文学习

论文笔记：Capsules for Object Segmentation

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)