多个任务超越moco v3！OPERA：监督学习和自监督统一的框架！

大家好，今天和大家分享一篇基于何恺明团队提出moco优化的算法。提出了一个监督学习和自监督统一的框架，表征能力更强，在多个下游任务上性能超越了 moco v3。

论文：https://arxiv.org/pdf/2210.05557.pdf

代码：https://github.com/wangck20/OPERA

创新点：

基于深度学习中度量学习的监督（fully supervised，FSL）和自监督（self-supervised learning，SSL）学习的统一框架
端到端可训练，在CNN和ViT上的各种任务性能都有所提高
在DeiT-B上，对比学习框架的性能与MIM方法（如MAE）相当

论文：OPERA: Omni-Supervised Representation Learning with Hierarchical Supervisions

摘要

现代计算机视觉中的预训练-微调范式促进了自监督学习的成功，这往往比监督学习获得更好的可迁移性。然而，随着大量标记数据的可用性，一个自然的问题出现了：如何训练一个更好的模型，同时包含自监督和监督信号？在本文中，我们提出了具有层次监督 (OPERA) 的 Omni-suPERvised Representation 学习作为解决方案。我们从标记和未标记的数据中提供了统一的监督视角，并提出了一个监督和自监督学习的统一框架。我们为每个图像提取一组分层代理表示，并对相应的代理表示进行自我和完全监督。卷积神经网络和视觉转换器的大量实验证明了 OPERA 在图像分类、分割和对象检测方面的优越性。