【论文阅读:1903.00905】:MILDNet: A Lightweight Single Scaled Deep Ranking Architecture

地址:https://arxiv.org/pdf/1903.00905.pdf

摘要:

多尺度深度卷积神经网络(multi-scaled CNN)在捕获用于视觉相似度任务的精细级和粗糙集的图像上都取得了很好的效果,但它会带来昂贵的内存开销和潜在后果。作者在这篇论文中提出了一种称作MILDNet的CNN网络,该网络十分简洁。作者受连续的卷积层描述的图像抽象特征会增加的启发,对网络进行了压缩。通过把多层中间层和最后一层耦合激活值,将深度级别CNN转变为一个CNN。网络的训练集为street2shop。作者证明了MILDNet的效果可以和当前最先进的网络效果一样好,且MILDNet的参数、模型大小、训练时间和推理时间只有其它网络的1/3。他还证明了中间层网络在图像检索任务的重要性在其它一些训练集上也有体现,所以虽然MILDNet是在电商领域数据训练的,但其它领域也可以应用。为了证明他们的假设,作者试过增加中间层来对比区别。作者还提出了两种更小级别的模型适用于小型设备。

总结

作者在文章中提出了一种新的卷积网络模型,该模型通过跳过连接层,使用单一的CNN可以取代3CNN模型用于视觉相似度概念的获取。在减小了模型大小的情况下在训练的数据集中也取得了很好的精确度。作者还做出了两个规模更小,功能少一点的变体。还提供了可以自适应视觉相似类别数据集的方法,并证明了整套流程的合理性。

猜你喜欢

转载自blog.csdn.net/wangqianqianya/article/details/88816319