Deeplab自读

Deeplab研读

迷迷糊糊过了一年,要为论文做准备了。最近在研读Deeplab,准备将其中具有代表性的点的理解记录一下。


感受野

感受野的出现是在引入带孔卷积dilated conv。作者对于带孔卷积的优点总结为:其能增大感受野而不增加卷积参数。
所以,感受野是个什么概念?对于提取feature map又有什么意义呢?

首先,了解一下一般意义上感受野的概念:

感受野,感受器受刺激兴奋时,通过感受器官中的向心神经元将神经冲动(各种感觉信息)传到上位中枢,一个神经元所反应(支配)的刺激区域就叫做神经元的感受野(receptive field)。又译为受纳野。
我们称直接或间接影响某一特定神经细胞的光感受器细胞的全体为该特定神经细胞的感受野(receptive field)。 —— [百度百科 ]

从概念上理解,感受野就是特征提取前的面积。
用图像更为形象的说明:
这里写图片描述
图(a)是带孔卷积rate = 1时,其结果与正常卷积操作一致,我们可以看到感受野为3*3。
图(b)中rate=2,实际的卷积核kernel为3*3。但是由于空洞的存在,只有红色标记的点是进行卷积操作的,我们可以看到实际上的感受野是7*7。
图(c)中rate=4。
这里写图片描述
可以看到,空洞卷积的感受野是远远大于传统卷积操作的。
传统双层卷积获得的感受野是5*5,而一个dilated-1和dilated-2串联获得的感受野为7*7。


此外,需要说明一下空洞卷积的意义。
语义分割网络fcn中用pooling和upsampling来获得结果。然而Hinton在演讲中曾经提到这两个层设计上的弊端:

  1. 其参数是不参与深度学习的
  2. 内部数据结构丢失;空间层级化信息丢失(该点尚未理解)
  3. 小物体无法重建(假设有四个pooling layer 则 任何小于 2^4 = 16 pixel 的物体信息将理论上无法重建)引自知乎

这些问题导致了语义分割的一个精度瓶颈,空洞卷积则可以解决这个问题,在不使用pooling层减少信息的同时增大感受野。


猜你喜欢

转载自blog.csdn.net/tgbnm1994/article/details/81776968
今日推荐