【图像处理】为什么CNN需要固定输入图像的尺寸

全连接层的输入是固定大小的,如果输入向量的维数不固定,那么全连接的权值参数的量也是不固定的,就会造成网络的动态变化,无法实现参数训练目的。

全连接层的计算其实相当于输入的特征图数据矩阵和全连接层权值矩阵进行内积,在配置一个网络时,全连接层的参数维度是固定的,所以两个矩阵要能够进行内积,则输入的特征图的数据矩阵维数也需要定。

大家都知道,
在这里插入图片描述
全连接神经网络结构一旦固定,需要学习的参数w是固定的,例如 输入图像是 28*28 = 784,w 的转置= (500,784),===> 输出矩阵的shape:(500,1),如果输入图像的大小改变,但是w的大小并不会改变,因此,无法计算。

综上,固定大小这个限制只是发生在了网络的深层(高层)处

当你用到包含全连接层的预训练模型时,就需要固定固定输入图片的大小。

若全为卷积网络,则不需要固定大小。

猜你喜欢

转载自blog.csdn.net/weixin_41990278/article/details/106611667