[论文阅读] State-Relabeling Adversarial Active Learning

论文地址：https://arxiv.org/abs/2004.04943
代码：https://github.com/Beichen1996/SRAAL
发表于：CVPR 20

Abstract

主动学习是通过对最有代表性的样本进行采样来设计标签高效的算法，由一个专家来标注。在本文中，我们提出了一个状态重标注对抗性主动学习模型(SRAAL)，它利用注释和已标注/未标注的状态信息来获得信息量最大的未标注样本。SRAAL由一个表示生成器和一个状态判别器组成。生成器使用互补的注释信息和传统的重建信息来生成样本的统一表示，将语义嵌入整个数据表示中。然后，我们在判别器中设计了一个在线的不确定性指标，它可以忍受具有不同重要性的未标记的样本。因此，我们可以根据判别器的预测状态来选择信息量最大的样本。我们还设计了一种算法来初始化标签池，这使得后续的采样更加有效。在各种数据集上进行的实验表明，我们的模型优于以前的主动学习方法，我们的初始采样算法取得了更好的性能。

I. Introduction

从思路上讲，本文属于ICCV 19中VAAL的改进，均属于利用VAE+Discriminator来进行样本价值判断。VAAL通过判断一个未标注样本与已标注样本集特征空间的相似程度，以此确定未标注样本的价值。而本文认为，与已标注集特征不相似并不一定就代表着高价值，只能代表模型暂时还没有学到这方面的特征。为此，本文引入了一些与任务相关的特征(VAAL是任务无关的)以综合考虑各方面的价值。

II. Method

在这里插入图片描述
首先，容易发现Supervised Target Learner(STL)与Unsupervised Image Reconstructor(UIR)构成了多任务学习的范式。假设UIR先进行，那么已标注集(labeled pool)与未标注集的(unlabeled pool)中的图像(不含标签)送入特征编码器(ResNet-18)进行编码。得到的特征将被送入一个完整的VAE中，进行无监督学习(图像重建)。将这一阶段得到的潜空间特征记为标注表征。可以发现，这一过程与VAAL是一致的。
接着进行STL。在STL阶段，只将已标注集图像送入特征编码器，并将得到的特征送入特征解码器以执行具体的任务(如分类，分割)。将这一阶段得到的潜空间特征记为任务表征。

最终，任务特征与标注表征进行连接，得到统一表征(unified repesentation)并送入判别器。相较于VAAL而言，可以看到本文引入了任务表征，从而避免了上文简介中所提到的问题。

接着来看判别器。对于VAAL，判别器的任务仅为判别样本是否已标注，为此其ground truth可以直接获得。然而，由于本文还引入了任务表征，为此标签中还必须考虑任务信息。具体来说，本文判别器的标签称为State Label，而所谓考虑的任务信息，则为实时计算的uncertainty值，该值的计算是通过Online Uncertainty Indicator完成的。

本文uncertainty的计算是通过启发式策略完成的，依然属于传统的根据softmax层输出进行决策的范畴(即，理论上可以通过entropy进行替代)。具体的计算公式可参考原文。至此，通过state label，便可以依据判别器选择有价值的样本。

对于初始已标注集构建的问题，本文视为一个K-Center问题来求解。通过聚类并取聚类中心，可以保证初始已标注集的diversity，从而避免出现bias以影响早期决策过程的准确性问题。