Image captioning数据集、评价指标和算法性能比较
作者:安静到无声 个人主页
1 数据集
基于深度学习的图像描述算法能够得到迅速发展,很大成度得益于大规模数据集的出现。数据集不仅是衡量和比较图像描述算法性能的重要依据,也是将图像描述算法推向越来越复杂、越来越具有实用性方向的强大动力。图像描述领域常见的数据集有Flickr8K、Flickr30K、MicrosoftCOCOCaption、VisualGenome、ConceptualCap‐tions、TextCaps、VizWiz-Captions、LocalizedNarra‐tives和FAshionCaptioningDataset。
- Flickr8K 数据集由 UIUC(University of Illinois at Urbana-Cham