NasNet实践:图像识别领域最佳模型

  谷歌最近推出的NasNet,是当前图像识别领域的最佳模型,近日对此模型进行复现了下,也大致了解了其原理。这个模型并非是人为设计出来的,而是通过谷歌很早之前推出的AutoML自动训练出来的。该项目目的是实现“自动化的机器学习”,即训练机器学习的软件来打造机器学习的软件,自行开发新系统的代码层,它也是一种神经架构搜索技术(Neural Architecture Search technology)。然而尽管AutoML 能够设计出性能可与人类专家设计的神经网络相媲美的小型神经网络,但仍被限制在 CIFAR-10 等小型学术数据集方面。

  1、论文原理

  而本文的模型,就是基于AutoML首先在CIFAR-10这种数据集上进行神经网络架构搜索,以便 AutoML 找到最佳层并灵活进行多次堆叠来创建最终网络,并将学到的最好架构转移到 ImageNet 图像分类和 COCO 对象检测中。这也就是NasNet的由来。

其中NasNet的组成由两种网络单元组合而成


这两种单元的堆叠方案如下:


2、论文实践

  在tensorflow slim模块中已经添加了该模型,它包含了mobile版本和large版本,本篇主要针对large进行了测试。




实践分析:NasNet的效果对比还没做实验,在tensorflow slim中介绍可知其精度为目前最高。

NASNet-A_Mobile_224# Code nasnet-a_mobile_04_10_2017.tar.gz 74.0 91.6
NASNet-A_Large_331# Code nasnet-a_large_04_10_2017.tar.gz 82.7 96.2
PNASNet-5_Large_331 Code pnasnet-5_large_2017_12_13.tar.gz 82.9 96.2

不过从实践的角度来看,NasNet的识别速度就远没有别的模型来得快。


猜你喜欢

转载自blog.csdn.net/sparkexpert/article/details/79834704