深度学习之卷积操作的实现

图像的卷积概述

      一般,通过对图片进行卷积操作,可以对图片进行某种效果的增强或者是减弱,比如模糊、锐化、浮雕效果等,当然也可以发现图片中的某些特征,如查找物体的边缘信息。

什么是卷积核

       一张图片卷积后的效果,绝大部分取决于它的卷积核。卷积核就是一个2维的数组,行列数相等而且为奇数(因为每个卷积核都是对于它中心的那个像素的作用,只有奇数才能有最中心的那个像素)。它里面的元素值代表不同的权值。一般而言,卷积核里面的所有元素之和为1,当然也可以不等于1.大于1时生成的图片亮度会增加,小于1时生成的图片亮度会降低。

          那么,卷积核是怎么作用在一张图上的呢?

针对输入图片中的单个像素,将它的值由周围临近像素值加权平均。而这种加权平均的操作产生的新像素值按照次序可以产生一张新的输出图片。

卷积后的尺寸

         如果输入尺寸是m x n, 输出尺寸是 l x c, 步长用stride表示, 卷积核大小为 k, 那么

  一般而言,输出尺寸都比输入尺寸要小,为了得到跟输入尺寸大小相同的图片,我们可以用padding。

Caffe 中的卷积操作原理

滑动窗口在图像中每滑动一个地方,将图像中该滑动窗口图像展开为一列,所有列组成图中的滑动窗口矩阵,这里假设pad=1,stride=1,K=3,则滑动窗口矩阵每行大小为W*H,一共K*K行.

每个核展开为一行,N个核形成的核矩阵大小为N*K*K。

最后将核矩阵和滑动窗口矩阵相乘,每一行就是一个特征图,N个卷积核形成N个特征图。

 

扩展到三维

三维和二维性质相同,不过是多了一个通道的概念。

参考:

https://blog.csdn.net/briblue/article/details/79654482

https://blog.csdn.net/qianqing13579/article/details/71844172

猜你喜欢

转载自blog.csdn.net/fairy_nn/article/details/81480488