深度学习基础--不同网络种类--VGG(visual geometry group,超分辨率测试序列)

VGG(visual geometry group,超分辨率测试序列)

test过程

  采用multi-scale输入尺寸的形式(输入尺寸介于[256:512]),具体执行流程如下:
  1)采用不同规格的图片作为输入(4种或6种规格);
  2)最后一个maxpool层之前按照原有网络执行;
  3)修改最后一个maxpool层为shift-max-pool,对网络中的最后一个卷积层的每一个feature map按照(0,1,2)的变化量分别在(x,y)方位上移位操作,之后进行max-pool操作,这样每个卷积层的feature map得到了9个shift-max-pool后的feature map。

offset max-pooling

  移位过程如下图所示,假设最后一个卷积层的一个feature map有一个1维的20 pixel的数据,按照size = 3,stride=3进行max_pooling,小于stride的部分不进行pooling。
在这里插入图片描述
  会产生多种(我们举个例子是9种)池化结果,分别送入后面的网络层,最后我们的图片分类输出结果就可以得到9个预测结果(每个类别都可以得到9种概率值,然后我们对每个类别的9种概率,取其最大值,做为此类别的预测概率值)。

猜你喜欢

转载自blog.csdn.net/wydbyxr/article/details/83956443
今日推荐