CNN卷积神经网络中的概念之1x1卷积核的作用

CNN(卷积神经网络)在机器视觉与图像识别领域应用越来越广泛,从简单的手写数字0-9mnist数据集识别到各种复杂的数据集识别与准确率提升。由于复杂的图片中含有很多其他的干扰,因此需要对图片进行滤波处理,也就是提取特征这既是卷积层的作用。
常用的卷积层中包括众多卷积核。卷积核中包括卷积核维数,卷积核通道数,以及卷积核的步长。通常使用的卷积核为1x1 3x3 5x5 ,卷积层可以对图像的维度大小进行压缩。
卷积层输出大小计算公式:
输入图片大小 W×W
Filter大小 F×F
步长 S
padding的像素数 P
输出图片维度为NxN
N=(W-F+2P)/S+1
所以我们可以推测1x1的卷积核的作用,比如输入为28x283的图片,1x13的卷积核,步长为1,padding=0
N=(28-1+0)/1+1=28
可以发现到输出图片维度并没有改变,但是输出的图像变为单通道的feature map,起到了图像压缩的效果,这就是1x1卷积核的作用。

发布了11 篇原创文章 · 获赞 4 · 访问量 432

猜你喜欢

转载自blog.csdn.net/baidu_39629638/article/details/104858149