目标检测:DETR详解

1. 概述

DETR: End-to-End Object Detection with Transformers, DETR 是 Facebook 团队于 2020 年提出的基于 Transformer 的端到端目标检测,是Transformer在目标检测的开山之作 – DEtection TRansformer

在这里插入图片描述
相比于传统的Faster-rcnn,yolo系列,DETR有以下几个优点:1).无需NMS后处理
2).无需设定anchor 3).高效并行预测。整个由网络实现端到端的目标检测实现,大大简化了目标检测的 pipeline。 DETR在COCO 数据集上效果与 Faster RCNN 相当,在大目标上效果比 Faster RCNN 好,且可以很容易地将 DETR 迁移到其他任务例如全景分割。

Transformer VS RNN

Transformer 比 RNN 更好,因为做到了并行化,不需要受到之前结果的影响。DETR把目标检测任务也变成一个 Set Prediction 任务,即一口气预测一个集合,而不是按照 RNN 一样一个一个预测。所以 DETR 最大的贡献,在于它提出了目标检测的新范式(新理解)—Set Prediction。论文的主要改进和实验结果总结如下图所示&

猜你喜欢

转载自blog.csdn.net/weixin_38346042/article/details/129178108