难样本

用 active learning 去找那些比较难的样本去学习有这5个步骤

1. 首先，把所有的未标注图片数据在大量自然图像中训练的网络，大家知道现在有很多常用的网络，从最初的LeNet、AlexNet、GoogLeNet、VGG、ResNet这样的网络中去测试一遍，得到预测值。然后挑出来那些最难的、信息量大的样本去标注

2. 用这些刚刚标注了的样本去训练深度学习网络，得到一个网络N

3. 把剩下没有标签的图像用N过一遍，得到预测值，挑一遍那些最难的，用人工去给它标注

4. 把刚刚标注了的样本和原来已经标好的样本一起，也就是整个标注集拿来继续训练这个网络

5. 重复3到4这个步骤，直到当前的分类器可以对选出来的比较难的图像很好的分类了。
---------------------
作者：DL_CreepingBird
原文：https://blog.csdn.net/DL_CreepingBird/article/details/78683202

刚才提到了两个指标来判定一个数据是不是难分的数据。entropy比较直观，预测结果在0.5左右就认为它是比较难分的；但diversity这个值不是很好刻画，就通过 data augmentation数据增强的方式来设计指标，就是说从一个图像设计出一系列它的变形。这些变形就可以是靠翻转、旋转、平移操作等等，一个变成了好几个甚至十几个，增加了它的多样性。然后对这些所有的变形去预测它们的分类结果，如果结果不统一的话，就说明这副图像的diversity比较强，那么这张图像就是比较难分的，是hard sample；反之就是比较好分的，那么就不去做它的增强了。然后对所有增强以后的数据的预测值应当是一致的，因为它们代表的是同一个东西，但是也有一些例外，如果是像我刚才说的那样的简单的数据增强。

这就会产生一个问题，原始的图像，比如左边这只小猫，经过平移、旋转、缩放等一些操作以后得到9张图，每张图都是它的变形。然后我们用CNN对这9张图求是一只猫的概率，可以看到上面三个图的概率比较低，就是判断不出来是一只猫，我们直观的去看，像老鼠、狗、兔子都有可能。本来这是一个简单的例子，很容易识别出来这是一只猫，但是增强了以后反而让模型不确定了。这种情况是需要避免的。

所以这种时候做一个 majority selection，就是一个少数服从多数的方式，因为多数都识别出来它是一只猫了。这就是看它的倾向性，用里面的6个预测值为0.9的数据，上面三个预测值为0.1的就不作为增强后的结果了。这样网络预测的大方向就是统一的了。
---------------------
作者：DL_CreepingBird
原文：https://blog.csdn.net/DL_CreepingBird/article/details/78683202

但是有一个缺点就是，fine-tune的参数不太好控制，有一些超参数，比如learning rate还有一些其它的，其实是需要随着模型的变化而变化的，而且比较容易一开始就掉入local minimal，因为一开始的时候标注数据不是很多，模型有可能学到一个不好的结果。

在每个候选集只选少量的patches计算熵和KL距离，KL距离就是描述diversity的指标，这样减少了计算量。传统的深度学习的时候会需要在训练之前就做数据增强，每个样本都是同等的；这篇文章里面有一些数据增强不仅没有起到好的作用，反而带来了噪音，就需要做一些处理；而且还有一些数据根本不需要增强，这样就减少了噪音，而且节省了计算。

猜你喜欢