论文 DeepEMD: Differentiable Earth Mover‘s Distance for Few-Shot Learning 小样本训练 图片分类

https://arxiv.org/abs/2003.06777

事实证明,深度学习在学习大量标记数据时非常有效。相比之下,很少有快照学习尝试只使用少量标记数据进行学习。在这项工作中,我们从图像区域间最佳匹配的新角度,开发了少镜头图像分类方法。我们使用 Earth Mover‘s Distance(EMD)作为度量来计算密集图像表示之间的结构距离,以确定图像相关性。EMD生成具有最小匹配代价的结构元素之间的最佳匹配流,用于计算分类的图像距离。为了在EMD公式中生成元素的重要权重,我们设计了一种交叉引用机制,该机制可以有效地缓解背景混乱和类内外观变化过大所造成的不利影响。为了处理k-shot分类,我们建议学习一个结构化的完全连接层,该层可以使用所提出的EMD直接对密集图像表示进行分类。基于隐函数定理,EMD可以作为一个层插入到网络中进行端到端的训练。大量实验验证了我们的算法的有效性,我们的方法在四个广泛使用的少量镜头分类基准(即miniImageNet、tieredImageNet、Fewshot-CIFAR100(FC100)和加州理工大学UCSD Birds-200-2011(CUB))上显著优于最先进的方法。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/x1131230123/article/details/120806181