1.输入图片
输入一张图片,为RGB三通道,像素为32x32,记为输入图像:32x32x3,3也叫深度:
2.卷积核
3.计算卷积
3.1如图,将输入图片展开(将图片周围补0),卷积核(有两个卷积核)也展开,图中连线的矩阵的每一个小格子,对应相乘,再相加
3.2将3个矩阵产生的结果求和,并加上偏置项,即0+2+0+1=3,因此就得到了输出矩阵的左上角的3:
3.3对第二个卷积核也作同样的操作
有几个卷积核,就出来几个这样的矩阵,深度就为几,卷积出来以后的图叫做特征图
3.4 滑动,这里滑动两个位置,这个叫做stride,这里stride=2
4.权值共享
所谓的权值共享就是说,给一张输入图片,用一个filter去扫这张图,filter里面的数就叫权重,这张图每个位置是被同样的filter扫的,所以权重是一样的,也就是共享。
5.池化(pooling)
池化的功能就是将特征图进行压缩,也是用一个卷积和去扫描,不过这次不是对应项相乘再相加,而是被卷积核扫描的区域取一个最大值,或者平均值,如图是最大池化
6.卷积神经网络的组成
relu层是激活层,将输入经过一个激活函数