深度学习：为什么要进行数据增强？

一个四格小漫画

在这里插入图片描述
我们看上面这幅漫画，故事里是一个顾客去拍风景照，因为不是实地取景，又想拍出多种不同的效果。
当前现状是，影楼只有一个实地的照片背景，那么如何满足顾客要求呢？没错，有请我们的P图大神，从各个不同的角度给顾客P图。
那么P出来的效果是什么呢？
效果就是照片看起来更加丰富，顾客很满意，可以乖乖掏钱了。。。
那么这个漫画和数据增强有啥关系呢？我们接着往下看：
（他们的共同点都是数据（图像）不足，同时又想得到多样化的数据效果）

那么我们在机器学习中，为何要进行数据增强呢？
在深度学习中，一般要求样本的数量要充足，样本数量越多，训练出来的模型效果越好，模型的泛化能力越强。但是实际中，样本数量不足或者样本质量不够好，这就要对样本做数据增强，来提高样本质量。
关于数据增强的作用总结如下：
1，增加训练的数据量，提高模型的泛化能力
2，增加噪声数据，提升模型的鲁棒性

数据增强的方法（我们以图像数据为例）：
1，数据翻转：数据翻转是一种常用的数据增强方法，这种方法不同于旋转 180 °。这种方法是做一种类似于镜面的翻折。
2，数据旋转：旋转就是顺时针或者逆时针的旋转，注意在旋转的时候，最好旋转 90 － 180 度否则会出现尺度的问题
3，图像缩放：图像可以被放大或缩小。放大时，放大后的图像尺寸会大于原始尺寸。大多数图像处理架构会按照原始尺寸对放大后的图像进行裁切而图像缩小会减小图像尺寸，这使我们不得不对图像边界之外的东西做出假设。
4，图像剪裁：这种方法更流行的叫法是随机裁剪，我们随机从图像中选择一部分，然后降这部分图像裁剪出来，然后调整为原图像的大小
5，图像平移：平移是将图像沿着 x 或者 y 方向（或者两个方向）移动。我们在平移的时候需对背景进行假设，比如说假设为黑色等等，因为平移的时候有一部分图像是空的，由于图片中的物体可能出现在任意的位置，所以说平移增强方法十分有用。
6，添加噪声：过拟合通常发生在神经网络学习高频特征的时候 (因为低频特征神经网络很容易就可以学到，而高频特征只有在最后的时候才可以学到) 而这些特征对于神经网络所做的任务可能没有帮助，而且会对低频特征产生影响，为了消除高频特征我们随机加入噪声数据来消除这些特征。

以下是上述方式的图像示例：
在这里插入图片描述

参考文章如下：
https://www.cnblogs.com/ziyan09/p/10412682.html
http://baijiahao.baidu.com/s?id=1599775088482026500&wfr=spider&for=pc

三景页三景页

发布了64 篇原创文章 · 获赞 25 · 访问量 9914

私信关注

深度学习：为什么要进行数据增强？

深度学习：为什么要进行数据增强？

猜你喜欢