计算机视觉:深层卷积神经网络的构建

本文重点

上一节课程中我们学习了单卷积层的前向传播,本次课程我们构建一个具有三个卷积层的卷积神经网络,然后从输入(39*39*3)开始进行三次卷积操作,我们来看一下每次卷积的输入和输出维度的变化。

第一层

第一层使用3*3*3的过滤器来提取特征,那么f[1]=3,然后步长s[1]=1,填充p[1]=0,也就是高度和宽度使用valid卷积。那么如果在l=1层我们使用10个过滤器,那么本层的输出图像的维度是37*37*10,这是第一层激活值的维度。

第二层

第一层的输出(37*37*10)作为第二层的输入,第二层我们使用5*5*10的过滤器,也就是f[2]=5,l=2层使用步长s[2]=2,填充p[2]=0,然后本层使用20个过滤器,那么本层的输出为17*17*20,(37+0-5)/2+1=17,这是第二层激活值的维度。

第三层

第二层的输出(17*17*20)作为第三层的输入,第三层我们使用过滤器为5*5*20,f[3]=5,s[3]=2,p[3]=0,然后本层使用40个过滤器,那么最终的输出图像的维度为7×7×40,(17+0-5)/2+1=7,这是第三层激活值的维度。

猜你喜欢

转载自blog.csdn.net/huanfeng_AI/article/details/132522282