深度学习——卷积神经网络认知

对CNN的认知

卷积神经网络（CNN）是一种特殊的对图像识别的方式，属于带有前向反馈的网络，可用来合理有效的减少神经网络的参数个数。其特点是经过多次特征提取，关联型、序列型或结构化等类型的特征被提取，主要来识别二维图形。

（1）输入层：代表一张图的像素矩阵；如32×32×3。

特征提取：

（2）卷积层：深入分析得到抽象程度更高的特征；经过卷积层的节点矩阵深度会增加。

（3）池化层：不改变三维结构，缩小矩阵的大小；高分辨率到低分辨率，缩小全连接层节点数，从而减少参数。

分类任务：

（4）全连接层：一般1到2层分类信息。

（5）softmax层：用于分类问题，得到不同种类的概率分布情况。

（1）三维结构的网络容量（包含：长、宽、高）。

包含三维空间中神经元的卷积神经网络，作为可视化的一个层。卷积网络的每一层都将三维输入转换为三维输出值。

扫描二维码关注公众号，回复： 3149992 查看本文章

分别代表像素和色彩通道

（2）组成部分

note：①过滤器尺寸只需制定两个维度，另一个要人工设置的是深度。

②对图像应用一个过滤器，将产生一个对应的特征图谱（FM）。

参数计算：【1】①当使用全0填充 out = [in / stride]

②不使用全0填充 out = [(in - filter +1 ) / stride ]

【2】参数（尺寸×输入深度+1）× 深度

note：最后一个池化层通常连接到一个或多个全连接层，全连接层的输出就是最终的输出。

（2）基本流程

1°输入图像，通过和若干过滤器和可加偏置进行卷积，产生相应个FM；

2°FM每组的四个像素进行求和、加权值和加偏置，通过sigmod函数得到相应特征映射图；

3°继续卷积直到最后一个子采样层；

4°将这些像素处理规则化，并连接成一个向量输入到传统的神经网络，得到输出。

通过感受区域和权值共享减少了神经网络需要的参数的个数。

（1）子采样层分组特征提取

原始数据分组特征提取，可以减少连接数目，即减少神经网络需要训练的权值参数的个数。

参数计算：若1000×1000的图像，隐层神经元个数1000×1000，权值参数个数为10^12。

局部感受域10×10，权值参数个数1000×1000×10×10=10^8。

（2）权值共享

应用小尺寸卷积核对应的参数共享在大尺寸图像上进行卷积，从而在大尺寸图像任意位置获得一个此特征的激活值。

参数计算：若10×10卷积核则100个权值参数，提取一种特征；共100个卷积核

权值参数个数：100种卷积核×每种卷积核共享100个参数=10000

note:此方法隐层参数个数和隐层神经元个数无关，只和卷积核的大小、种类有关。