Shifting More Attention to Video Salient Object Detection (CVPR 2019)

Shifting More Attention to Video Salient Object Detection

现实生活中缺少一个完善的高质量标注的视频显著性目标检测(video salient object detection, VSOD)数据集。因此,本文构建了一个视频注意力一致,稠密标注的VSOD数据集,简称DAVSOD。这个数据集包含226个视频,共23938帧,涵盖了多种真实场景,物体,实例和动作。借助相应的真实眼动注视点数据,得到精确的用户标注。从而首次明确强调了具有挑战性的显著性转移现象,即视频中的显著对象可能会动态改变。
为了进一步给VSOD领域提供一个全面的评测,本文在7个现有数据集和构建的DAVSOD数据集上系统评估17个最具有代表性的VSOD算法。同时,提供了一个基准模型,它配备了一个面向显著性转移的长短时记忆卷积网络(convLSTM),可通过学习人类注意力转移行为来有效的捕获视频动态显著性。

本文贡献:
1)构建了一个数据集;
2)对17种最先进的模型进行全面的评测,同时,提出一个名为SSAV的基础模型。

提出的基础模型框架结构如下:
在这里插入图片描述

发布了24 篇原创文章 · 获赞 2 · 访问量 4581

猜你喜欢

转载自blog.csdn.net/weixin_44790486/article/details/104412231