小样本学习 | Learning to Compare: Relation Network for Few-Shot Learning

博主github:https://github.com/MichaelBeechan
博主CSDN:https://blog.csdn.net/u011344545

Learning to Compare: Relation Network for Few-Shot Learning

论文下载:https://arxiv.org/pdf/1711.06025.pdf
代码:https://github.com/MichaelBeechan/LearningToCompare_FSL
https://github.com/lzrobots/LearningToCompare_ZSL
在这里插入图片描述

摘要

我们提出了一个概念上简单,灵活和通用的框架,用于小样本学习,其中分类器必须学习识别新类,只给出几个例子。 我们的方法称为关系网络(RN),是从头开始端到端训练的。 在元学习期间,它学习学习深度距离度量以比较剧集中的少量图像,每个图像旨在模拟少数镜头设置。 一旦经过训练,RN就能够通过计算查询图像与每个新类的小样本示例之间的关系得分来对新类别的图像进行分类,而无需进一步更新网络。 除了提供改进的小镜头学习性能外,我们的框架还可以轻松扩展到零镜头学习。 对五个基准测试的广泛实验表明,我们的简单方法为这两个任务提供了统一有效的方法。

简介

深度学习模型在视觉识别任务中取得了巨大成功[22,15,35]。然而,这些监督学习模型需要大量标记数据和许多迭代来训练其大量参数。由于注释成本,这严重限制了它们对新类别的可扩展性,但更根本地限制了它们对新出现的(例如,新的消费者设备)或稀有(例如,稀有动物)类别的适用性,其中许多注释图像可能根本不存在。相比之下,人类非常擅长用很少的直接监督识别物体,或者根本没有,即小样本[23,9]或零样本[24]学习。例如,孩子们没有问题从书中的单个图片概括“斑马”的概念,或听到它的描述看起来像条纹马。由于传统的深度学习方法无法在每个班级的一个或几个例子中运作良好,并受到人类的小样本和零样本学习能力的启发,最近出现了对机器 one/few-shot的兴趣的复兴[8,39,32,18,20,10,27,36,29]和零样本[11,3,24,45,25,31]学习。
小样本学习的目的是从极少数标记的例子中识别新颖的视觉类别。只有一个或几个例子的可用性挑战了深度学习中标准的“微调”实践[10]。数据增强和正则化技术可以减轻这种有限数据体系中的过度拟合,但它们无法解决这一问题。因此,针对小样本学习的现代方法通常将训练分解为辅助元学习阶段,其中可转移知识以良好的初始条件[10],嵌入[36,39]或优化策略[29]的形式学习。然后通过使用学习的优化策略[29]进行微调[10]或在前馈传递[36,39,4,32]中计算而不更新网络权重来学习目标小样本学习问题。零样本学习也受到相关挑战的影响。识别者通过一个例子以类别描述的形式进行训练(例如,一次性中的单一样本图像),使基于梯度的学习的数据不足成为挑战。
虽然很有希望,但大多数现有的小样本学习方法要么需要复杂的推理机制[23,9],复杂的递归神经网络(RNN)架构[39,32],要么微调目标问题[10,29]。我们的方法与其他旨在培养一次性学习有效指标的方法最为相关[39,36,20]。如果他们专注于可转移嵌入的学习并预先定义一个固定的度量(例如,作为欧几里德[36]),我们进一步的目标是学习一个可转移的深度量度来比较图像之间的关系(小样本学习),或者图像和类描述之间(零样本学习)。通过表达更深层解决方案的归纳偏差(嵌入和关系模块中的多个非线性学习阶段),我们可以更轻松地学习问题的一般解决方案。
具体而言,我们提出了一种双分支关系网络(RN),它通过学习将查询图像与少数标记的样本图像进行比较来执行几次识别。首先,嵌入模块生成查询和训练图像的表示。然后通过关系模块比较这些嵌入,该关系模块确定它们是否来自匹配的类别。定义一个受[39,36]启发的基于剧集的策略,嵌入和关系模块是端到端的元学习,以支持少数镜头学习。这可以看作是将[39,36]的策略扩展到包括可学习的非线性比较器,而不是固定的线性比较器。我们的方法胜过先前的方法,而更简单(没有RNN [39,32,29])和更快(没有微调[29,10])。我们提出的策略也直接推广到零样本学习。在这种情况下,样本分支嵌入单样本类别描述而不是单个样本训练图像,并且关系模块学习比较查询图像和类别描述嵌入。
总的来说,我们的贡献是提供一个干净的框架,优雅地包含少数和零样本学习。我们对四个基准测试的评估表明,它提供了全面的引人注目的性能,同时比替代方案更简单,更快速。

续。。。。。。。。。。。。

在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结论

我们提出了一种称为关系网络的简单方法,用于小样本和零样本学习。 关系网络学习嵌入和深度非线性距离度量,用于比较查询和样本项。 通过情节训练训练网络端到端,调整嵌入和距离度量,以实现有效的少数学习。 这种方法比最近的几次元学习方法更简单,更有效,并产生了最先进的结果。 它进一步证明在传统和广义零样本设置中都是有效的。

发布了127 篇原创文章 · 获赞 117 · 访问量 16万+

猜你喜欢

转载自blog.csdn.net/u011344545/article/details/91541309