梅科尔工作室-深度学习-CNN

1.基本概念

2.cnn常见任务

3.cnn组成

1.基本概念

卷积神经网络（Convolutional Neural Networks，cnn）是一种具有卷积计算且包含深度结构的前馈神经网络，是深度学习算法之一。

扫描二维码关注公众号，回复： 17030798 查看本文章

传统图像处理机器学习算法对数据量要求很大，效率低，并且很难保有原有特征，导致准确率偏低。而cnn也因能降维图像数据，使数据量变小并且保留原有特征而在如今图像处理领域大放光彩。

2.cnn常见任务

（1）图像分类（Image Classification）：检测出图片中有哪些物品

（2）目标检测（Object Detection）：检测出物品，并将位置标出来，比较简单的是对角线确定一个物体，然后框起来

（3）语义分割（Semantic Segmentation）：将不同类用不同颜色标出来（针对像素），同一类物体一个颜色背景也单独拎出来。

（4）实例分割（Instance Segmentation）：把物品视为对象，即使是同一类物品也用不同颜色标出来，并且一般不把背景拎出来。你需要什么，分割什么。

3.cnn组成

3.1.输入层（Input Layer）

图片输入，经过处理后变为像素矩阵。

3.2.卷积层（CONV Layer）

卷积层又被成为过滤器或者卷积核或者内核，用来提取图像局部的特征。

像素矩阵通过与卷积核（过滤器）进行内积。在进行卷积操作之前，会对矩阵最外围进行数据填充（zero padding），一般是填充0，padding为填充的圈数，当padding为1时会在外围填充一圈0，当padding为2时会在外围填充两圈0。

对矩阵进行数据填充的目的是避免特征值运用不均衡，如果进行数据填充，以下图卷积计算为例，四个角特征值只被用了一次，中间特征值杯用了四次，其他四个特征值被用来两次。这就造成特征值运用不全。而当你在矩阵外围进行数据填充，可以发现每个数据被利用次数是相同的（要一视同仁）。

在进行卷积计算的时候，你可以设置卷积核移动的步幅（stride），如上图卷积核移动的步幅是1，从左往右，到尽头后再下移行从左边重新移动。当你设置stride为2时，卷积核每次会移动两列。设置步幅的目的是减少输入参数数量，减少计算量。

3.3.激活层（ReLU Layer）

通常情况下，输入与输出之间是线性的，如原来是wx+b，第二步再计算，把第一步值代入x，最终得出的自变量次数还是1（这里你可以将线性理解成一次函数，线性代数中对线性的解释是满足加法封闭以及数乘封闭），不够带入多少次只有x前面的系数以及常数项发生变化，自变量幂数没有变，x仍满足线性条件。增加激活函数后，能够实现非线性计算。可以把线性的操作拟合成非线性的。