DEFT解读
简介
最近不少2D多目标跟踪(Multiple Object Tracking,MOT)的成果表明,使用SOTA检测器加上简单的基于空间运动的帧间关联就可以获得相当不错的跟踪表现,它们的效果优于一些使用外观特征进行重识别丢失轨迹的方法。Uber等最近提出的DEFT(Detection Embeddings for Tracking)是一种联合检测和跟踪的模型,它是一个以检测器为底层在上层构建基于外观的匹配网络的框架设计。在二维跟踪上,它能达到SOTA效果并具有更强的鲁棒性,在三维跟踪上它达到了目前SOTA方法的两倍性能。
-
论文标题
DEFT: Detection Embeddings for Tracking
-
论文地址
http://arxiv.org/abs/2102.02267
-
论文源码
https://github.com/MedChaabane/DEFT
介绍
卷积神经网络的发展推动了目标检测领域的进步,TBD范式(Tracking by Detection)的MOT也取得巨大的突破,最近的研究表明,在SOTA跟踪器上添加简单的跟踪机制就可以比依赖旧检测架构的复杂跟踪器效果更好。TBD范式的跟踪框架通常有两步:检测:在当前帧检测出所有目标;关联:将当前帧上的目标和之前帧上的目标进行链接。跨帧关联的方法有很多,但是那些特征可学习关联方法通常更有趣一些,因为它们有望解决建模和启发式方法失败的情况。
即使有了可学习关联,二阶