计算机视觉系列-论文学习 INTERN: A New Learning Paradigm Towards General Vision

计算机视觉系列-论文学习 INTERN: A New Learning Paradigm Towards General Vision

OpenGVLab 开源通用视觉开发平台
作为人工智能技术的下一个重要里程碑,通用人工智能技术将带来颠覆性创新。上海人工智能实验室、商汤科技、香港中文大学和上海交通大学联手打造一个协作、包容、和持久的开源社区,用于推进通用视觉人工智能,名为 OpenGVLab。OpenGVLab 将依靠我们的新开发了通用视觉学习范式 INTERN,以推动工业、学术界和研究领域的进步。

  • 数据
    具有 100 亿个样本和各种监控信号的超大规模视觉数据集集合。
  • 基准
    一组基准任务,旨在为评估一般视觉能力提供全面的基准。
  • 模型
    一组具有新颖模型架构和多阶段预训练的高性能通用视觉模型。

INTERN

论文链接
https://arxiv.org/abs/2111.08687
在这里插入图片描述
过去几年,以人工智能技术进步为标志的技术创新浪潮正在深刻地重塑行业和社会。然而,在未来,一个关键的挑战等待着我们,即我们满足快速增长的特定场景需求的能力受到获取相应数量的训练数据的成本的严重限制。这种困难的情况本质上是由于主流学习范式的局限性:我们需要为每个新场景训练一个新模型,基于大量注释良好的数据,并且通常从头开始。在解决这个基本问题时,我们超越并开发了一种名为 INTERN 的新学习范式。通过在多个阶段学习来自多个来源的监督信号,正在训练的模型将具有很强的泛化性

猜你喜欢

转载自blog.csdn.net/duan_zhihua/article/details/125284418