【论文笔记1】小样本分类

FSL学习笔记

最新论文&代码收集网站:网址连接

论文1:孪生网络 (Metric Based)

Siamese Neural Networks for One-shot Image Recognition

通过Siamese神经网络借助监督度量的方法学习图像表示,然后重用该网络的特征进行OneshowtLearning,而不需要任何再训练。

孪生网络由两个结构相同(参数也相同:权重绑定了)的网络组成,这两个网络接受不同的输入,并且这两个网络最后由一个能量函数(Energy fuction)汇合到一起。这个Energy Fuction用于计算两个特征图之间的距离。
使用加权的L1距离来进行特征向量之间的距离,并结合了sigmoid激活函数。(使用了交叉熵损失函数)
孪生网络的模型结构如图所示。 最后的卷积层中的单位被压平成一个矢量。
网络模型结构
预测向量(prediction vector)的公式是:p =
在这里插入图片描述
其中,σ是sigmoi的函数,αj是对每个向量的第j维的权重进行调节(是可学习的参数)。
所定义的交叉熵损失函数如下所示:
损失函数
当两张图片相同时y=1;当两张图片不同时y=0。

论文2 匹配网络 (Metric Based)

Matching Networks for One Shot Learning

比较高明的解读:链接
研究背景

  1. 少样本数据经常存在,但是
  2. 数据增强和正则化方法能够避免过拟合,却不能让网络学习的很好
  3. 需要随机梯度下降多次,这是浪费时间的

研究贡献

  • 提出了一种匹配网络MN
  • test and train conditions must match. (为了使得网络能够更快的适应新的模型算法,即 训练的时候就和测试一样都是一样的输入方式)
  • 关键:经过训练后,匹配网络能够为未观察到的类产生合理的测试标签,而不需要对网络进行任何更改

猜你喜欢

转载自blog.csdn.net/vibration_xu/article/details/125956287
今日推荐