论文 简单的多数据集检测 Simple multi-dataset detection

https://arxiv.org/pdf/2102.13086.pdf

我们如何建立一个通用和广泛的目标检测系统?我们使用所有标注过的概念的所有标签。这些标签跨越具有潜在不一致分类的不同数据集。在本文中,我们提出了一种在多个大规模数据集上训练统一检测器的简单方法。我们使用特定于数据集的训练协议和丢失,但与特定于数据集的输出共享一个通用的检测体系结构。我们展示了如何将这些特定于数据集的输出自动集成到通用语义分类中。与以前的工作相比,我们的方法不需要手动分类协调。我们的多数据集检测器在每个训练域上的性能与特定于数据集的模型一样好,但在新的未知域上的通用性要好得多。基于所述方法的条目在ECCV 2020鲁棒视觉挑战赛的目标检测和实例分割轨迹中排名第一.

没有一个单一的损失可以推广到所有数据集。在下一节中,我们将展示多数据集训练的不同视图,并展示如何训练在所有数据集上都表现良好的模型。

我们的核心观点是,只要我们不尝试合并不同数据集之间的标签空间,我们就可以像单独训练多个数据集特定检测器一样训练统一检测器。

Each dataset-specific architecture shares all but the last layer with the common backbone.
Each dataset uses its own classification layer at the end.

标准检测器(a)在一个数据集上进行训练,该数据集具有特定于数据集的损失。我们在具有共享主干、数据集特定输出和丢失的多个数据集上训练单个分区检测器(b)。最后,我们将分区检测器的输出完全自动地统一到一个通用分类法(c)中:
在这里插入图片描述

Ablation of our multi-dataset training strategies. We start with simple merging of datsets (Wang et al.,2019), then add a uniform sampling of images between different training datasets (second row), class-aware sampling within Objects365 and OpenImages (third row), and both sampling strategies (forth row). Our partitioned detector combines these sampling strategies with a dataset-specific loss (last row).:

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/x1131230123/article/details/120792327