细粒度分类论文阅读笔记

CurriculumNet(ECCV2018,码隆科技发表) 。已公开部分代码基本可以实现(开发平台:Caffe)。仅需要标记出类别。它是适用于大规模网络图像分类(细粒度分类)的半监督学习,按照复杂度(complexity)把训练集划分为“容易”、“困难”、“特别困难”三个子集,即clean data,noisy data,highly noisy data。但是noisy data,highly noisy data的比例难以掌控。未提供pretrained-model 重头开始训练可能会多耗费一些时间。

α-pooling model(ICCV2017,UC Berkeley发表)。已公开部分代码基本可以实现(开发平台:Caffe)。可以不使用ground-truth part or bounding box annotations。该模型在Pooling层设计了一种Pooling Strategy,该策略通过利用参数α把average pooling 和bilinear pooling结合在一起。但是α的值需要根据大量实验确定,并且作者没有验证α-pooling model在大规模数据集上的性能。

Bilinear CNN(ICCV2015,University of Massachusetts,Amherst发表)。需要Bounding Box Annotations。公开代码是Matlab语言写的(MatConvnet实现),不适合工业级应用,代码用其它语言转写会耗费一点精力。该模型利用外积(matrix outer product)来组合CNN stream A和CNN stream B的feature map。但是该模型仅在Caltech-UCSD Birds 200(200 categories, 6,033 images)等小规模数据集上验证。

猜你喜欢

转载自blog.csdn.net/u012751110/article/details/103625473
今日推荐