这篇文章主要贡献如下:
- 对零样本学习分类进行了层次划分
- 对零样本学习设定进行了形式化分类和定义
- 对零样本学习语义空间进行了分类
当然,还有很重要的一点是,文章对未来方向的分析。
1. Introduction 为什么零样本学习?
原因有二:
- 但现实场景中,许多的任务需要对从未见过的样本进行分类
- 很多任务重标注样本代价太大
5. Future Directions
5.1 输入数据的特性研究
- 基于传感器的活动识别,可以利用数据的时序特性;
- 目标分类可以利用part信息;
- 视频相关问题,可以利用多模态信息
5.2 训练数据的选择
- 异构训练数据和测试数据:
1)不同语义类型:训练数据是物体图像,测试数据是场景图像
2)不同数据类型:训练数据是图像+视频,测试图像是视频 - 训练数据的动态选择
假设1:可见类能够动态选择
假设2:训练样例可以动态标记
5.3 辅助信息的选择和保持
目标是选择更有帮助的辅助信息。现在的辅助信息是受人类视觉识别系统启发。应该有其他的方法来作为辅助信息。
比如,人类定义的相似性信息;比如学到的属性信息。
保持信息,是因为在只学习分类器的时候很可能会丢弃一部分语义信息。比如有的方法通过一个重构模型来保持更多的语义信息。
5.4 更实际和应用特定的问题设定
例如,广义的零样本学习,就是要同时识别已见类和未见类。
更实际和更特定于任务的设定,会被探索。比如,在某些应用中,要识别的类别特别多。这就是大规模场景下的设定。还有一些训练实例和语义信息是在线可获取的,一些在线增量学习通过学习新的属性并用在线的方式适配这些新的属性。基于应用的特定,更多的场景特定的零样本学习问题将会被探索。
5.5 理论保证
一些理论问题还没有被解决:
1)怎么选择辅助信息?
2)为了辅助测试实例的分类,我们要从训练实例中迁移什么信息?
3)如何抑制无关信息,避免负迁移
5.6 和其他学习范例的结合
比如,网络监督学习、小样本学习。
小样本学习的学习模式?
还有诸如动态学习、终身学习、哈希、强化学习等机器学习方法结合。