A guide to receptive field arithmetic for Convolution Neural Networks

目标

  • 感受野的大小
  • 感受野的中心

感受野

  • 定义
    • 卷积神经网络每一层输出的特征图上的像素点在原始图像上映射的区域大小
  • 可视化——有两种方式将感受野形象地表示出来,

    • 第一种:如左图所示,每一层的输出为真实输出的大小,在原始图像中灰色部分为感受野,在这种方式下,感受野的中心点和大小不是很容易计算。
    • 第二种,如右图所示,每一层的大小与原始图像的大小一致,带颜色表示有数据,空白表示无数据。(蓝色为原始图像(大小为5),绿色第一层输出,橙色为第二层输出,卷积参数:s=2、p=1、k=3)
      这里写图片描述
      • 第一层输出
        这里写图片描述
      • 第二层输出
        • 以第一层输出为基础
          这里写图片描述
        • 以原始图像为基础
          这里写图片描述
  • 计算

    • 设定变量
      • 卷积中的 s, p, k
      • n:每一维度的长度
      • r: 感受野的大小
      • j: 两个相邻单元的距离
      • start: 左上角的第一个单元的中心点的坐标
    • 计算公式
      • n o u t = n i n + 2 p k s + 1
      • j o u t = j i n s
      • r o u t = r i n + ( k 1 ) j i n
      • s t a r t o u t = s t a r t i n + ( k 1 2 j i n )
  • 例子
    这里写图片描述
    • 其中 s t a r t 0 = 0.5 ,由于是原始图像是正方形,所有横纵坐标相等,都为0.5,也可以写为 ( 0.5 , 0.5 )
    • 如果把输出层的左上角的第一个单元标号为 ( 1 , 1 ) ,沿着x,y递增,若知道某单元的标号j为 ( p , q ) ,那么其感受野的中心点的坐标为 ( 0.5 + ( p 1 ) j o u t , 0.5 + ( q 1 ) j o u t )

原文

猜你喜欢

转载自blog.csdn.net/sda42342342423/article/details/80898436