one-shot系列:review of Matching Networks for One Shot Learning

最近看了几篇one-shot系列的论文,对于我来说真的是头大啊,耐着性子用着翻译软件每篇论文读了五六遍之后,也算是懂了吧

这一篇先来写一下:Matching Networks for One Shot Learning

这篇文章主要讲的就是匹配问题,对于surport set(待匹配集合)可以出现训练集中从未出现的类别

首先网络结构图

如上图左侧四只是一个surport set也就是训练集,右下那只test sample,五只一起组成一个task

主要任务就是匹配test sample具体是属于surport set中的哪一类S → cS(ˆx) 用概率的公式可表示为P(ˆy|x, S ˆ ) 其中的S就是surport set 

首先经过g f 文中用的四层卷积网络得到图片的特征然后通过LSTM增强个体与全局的联系

然后做cos距离上的softmax 最后匹配test sample的类别

模型结构:

其中

 c就是计算余弦距离

 对于LSTM其实是一种特殊的RNNs网络,RNNs通过不停的将信息循环操作,保证信息的持续存在,但同时带来了长依赖的问题

LSTM通过门结构(遗忘门、输入门、输出门)来对信息进行增删,从而解决长依赖的问题。

rnns和lstm结构图如下:

rnns:

 lstm:

整体网络结构代码如下:

 最后实验:1,首先是在omniglot数据集上,此数据集与mnist手写体数据集类似

 2.在作者从imgnet数据集随机选取了100类数据做成一个minimgenet数据集

 

 

 3。同样在imagenet数据集上作调整:

猜你喜欢

转载自www.cnblogs.com/stt-ac/p/12166360.html