CVPR 2023 | 用于半监督目标检测的Active Teacher方法

前言 本文从数据初始化的角度研究师生模型,并提出了一种名为 Active Teacher 的半监督对象检测 (SSOD) 新算法。Active Teacher 将师生框架扩展到迭代版本。同时,还从信息量、多样性和难度等方面考察了样本的选择,让Active Teacher 最大限度地主动选择那些最有可能增加模型准确性的未标记样本,并将这些样本用于半监督目标检测中的训练。
在 COCO baseline上,与一组最近提出的 SSOD 方法进行的实验结果不仅验证了 Active Teacher 相对于比较方法的卓越性能增益,而且表明它使的基准网络,即 Faster-RCNN,能够以更少的标签支出实现 100% 的监督性能,即 40% 的标签MS-COCO 上的示例。

Transformer、目标检测、语义分割交流群

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

论文:https://arxiv.org/pdf/2303.08348.pdf

代码:https://github.com/HunterJ-Lin/ActiveTeacher

论文出发点

一些用于半监督目标检测 (SSOD) 使用 teacher-student 的知识蒸馏方法,这需要 teacher 模型为 student 网络生成高质量的伪标签。虽然自训练产生了大量的伪标签,但真实标签信息在训练初期仍然起着关键作用,它决定了伪标签的质量和教师网络的性能下限,因此,ground-truth 标签信息在 SSOD 中起着重要作用。为了探究如何在 SSOD 中为 teacher-student 选择出最佳的标签样本,作者提出了一种新的知识蒸馏方法 (Active Teacher)。

创新思路

本文提出 Active Teacher 将传统的师生框架扩展为迭代框架,其中标签集部分初始化并通过一种新颖的主动采样策略逐渐扩充。通过这种修改,Active Teacher 可以通过主动采样最大限度地发挥有限标签信息的作用,同时也可以提高伪标签的质量。并且进一步从难度、信息和多样性等方面研究了标签样本的选择,并且这些指标的值自动组合而无需超参数调整。实现通过这些指标,可以探索什么样的数据最适合 SSOD。

方法

Framework

Active Teacher 的总体框架如下图所示,该架构由一个迭代的 teacher-student 结构组成,其中初始化部分标签集并逐渐增加。每次迭代后,使用训练有素的teacher网络根据得到的指标(即信息、多样性和难度)评估未标记示例的重要性,并据此进行数据扩充。

Active Teacher 包括两个检测网络,即Teacher 和 Student具有相同的配置(Faster-RCNN)。Teacher 用于生成训练 Student 的伪标签,其参数通过 EMA 从 Student 逐渐更新。Teacher 还用于估计未标记的样本以进行主动采样。

损失函数

Student 模型的损失函数如下:

其中,Lsup 和 Lunsup分别代表学生接受了真实标签和伪标签的训练损失 。它们各自的表达式如下:

里面的内部式子如下:

Active Sampling

在每次半监督训练后通过教师网络进行部分标签的初始化和扩充,引入了三个主动采样指标,即Difficulty、Information和Diversity,来衡量什么样的标签对检测任务至关重要。其中,Difficulty根据模型预测的概率分布的熵进行测量。较高的熵表明模型对其预测的不确定性更大,表明样本更困难;Information衡量 SSOD 未标记图像信息量的指标;Diversity衡量图像中对象类别分布的指标。

然后就是对以上三个指标进行组合,由于这些指标的取值范围差异很大,首先需要对其进行归一化。其次,构建一个三维采样空间来将每个样本的这三个指标,每个未标注样本的评价结果都可以看作是这个空间中的一个点。

结果

作者在COCO数据集上进行了验证,下面是所提的Active Teacher 与其他 SSOD 方法在 MS-COCO val2017 上对 mAP (50:95) 指标的比较,可以看到所提方法精度达到了SOTA

对提出的三个评价指标(Difficulty、Information和Diversity)进行的消融实验,表明它们对于 SSOD 有利

还有检测结果的可视化展示

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。

模型部署交流群:732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。

其它文章

CVPR 2023 | 用于半监督目标检测的知识蒸馏方法

目标跟踪方向开源数据集资源汇总

CVPR2023 | 书生模型霸榜COCO目标检测,研究团队解读公开

Vision Transformer的重参化也来啦 | RepAdpater让ViT起飞

高效压缩99%参数量!轻量型图像增强方案CLUT-Net开源

一文了解 CVPR 2023 的Workshop 都要做什么

CVPR'23 最新 70 篇论文分方向整理|包含目标检测、图像处理、人脸、医学影像、半监督学习等方向

目标检测无痛涨点新方法 | DRKD蒸馏让ResNet18拥有ResNet50的精度

PyTorch 2.0正式版来了!

CV各大方向专栏与各个部署框架最全教程整理

计算机视觉入门1v3辅导班

计算机视觉交流群

猜你喜欢

转载自blog.csdn.net/KANG157/article/details/129707501