数据增广领域知识

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/m0_37789876/article/details/82630605

PCA的数据增广:
比如对数据进行PCA操作,比如取前5个主成分,对主成分进行加随机系数,再进行PCA还原,产生了新的数据。

label smoothing:
采用了非one-hot的标签集减轻了过拟合的方法

MIXUP:
X = aXi+(1-a)Xi-1
Y = aYi+(1-a)Yi-1
生成四不像图片,标签也为一个非one-hot的标签

Random Erasing:
随机覆盖

有监督的进行数据增广:
利用多层卷积+GMP+全连接训练网络
通过最后一层卷积用全连接权重进行加权平均,生成热力图,通过热力图找到显著点。围绕显著点进行crop(随机切割)

半监督学习:
在线学习,通过实时流的数据进行判断,如果可信度高的话,就可以拉入网络继续训练。

GAN数据生成:
用其他的分类器去判断GAN生成的数据是不是有训练价值的。
首先需要保证的是SVM分类器的效果要好,怎么判断SVM的效果好呢?那么需要给SVM分类器打分,比如我有1000张BUS图片,1000张不是BUS的图片,我用500+500去训练一个SVM,再把另外的500+500放进去判断,这样就可以得到2个准确率,一个是训练的准确率,还有一个是测试的准确率。然后score = 0.4score1+0.6score2就是最后的分数。
然后通过GAN生成一批BUS和非BUS数据,取出支持向量,加入第一次的500+500,训练SVM,然后把真实的500+500和500+500带入看看分数,如果分数有提高,表明生成的数据训练的SVM分类器的效果比真实数据要好,我们就可以把这些支持向量数据拿去做训练了。

如何去选择增广方案:
class conditional
每种增广方式都做一遍,看看每类数据在不同的增广下的变化,是变好了还是变坏了。

猜你喜欢

转载自blog.csdn.net/m0_37789876/article/details/82630605