『计算机视觉』空洞卷积（待续） - 代码天地

『计算机视觉』空洞卷积（待续）

其他 2018-09-21 17:50:48 阅读次数: 0

一、空洞卷积的提出

空洞卷积（atrous convolutions）又名扩张卷积（dilated convolutions），向卷积层引入了一个称为 “扩张率(dilation rate)”的新参数，该参数定义了卷积核处理数据时各值的间距。

该结构的目的是在不用pooling（pooling层会导致信息损失）且计算量相当的情况下，提供更大的感受野。顺便一提，卷积结构的主要问题如下：

池化层不可学

内部数据结构丢失；空间层级化信息丢失。

小物体信息无法重建 (假设有四个pooling layer 则任何小于 2^4 = 16 pixel 的物体信息将理论上无法重建。)

而空洞卷积就有内部数据结构的保留和避免使用 down-sampling 这样的特性，优点明显。

二、空洞卷积原理

如下如，卷积核没有红点标记位置为0，红点标记位置同正常卷积核。

假设原始特征为feat0，首先使用扩张率为0的空洞卷积生成feat1，feat1上一点相对feat0感受野为3*3（如图a）；

然后使用扩张率为1的空洞卷积处理feat1生成feat2（如图b），使第一次空洞卷积的卷积核大小等于第二次空洞卷积的一个像素点的感受野，图b即feat1上一个点综合了图a即feat0上3*3区域的信息，则生成的feat2感受野为7*7，即整个图b深色区域；

第三次处理同上，第二次空洞卷积的整个卷积核大小等于第三次空洞卷积的一个像素点的感受野，图c即feat2上每个点综合了feat0上7*7的信息（感受野），则采用扩张率为3的空洞卷积，生成的feat3每一个点感受野为15*15。

相比较之下，使用stride为1的普通3*3卷积，三层之后感受野仅仅为(kernel-1)*layer+1=7。

三、空洞卷积问题

感受野跳跃

我们对同一张图连续三次使用扩张率为1的空洞卷积，观察整张图的中心点的感受野（如下图）

很明显，感受野不连续（我们上一小结的例子就没这个问题，所以空洞卷积依赖网络设计）。

小尺度物体检测

类似第一个问题，仍然需要调整扩张率的组合来解决这个问题。

四、网络设计研究

五、常用框架API介绍

六、参考来源

【Tensorflow】tf.nn.atrous_conv2d如何实现空洞卷积？

如何理解空洞卷积（dilated convolution）？

猜你喜欢

转载自www.cnblogs.com/hellcat/p/9687624.html

『计算机视觉』空洞卷积（待续）

『计算机视觉』空洞卷积

『计算机视觉』棋盘效应（待续）

计算机视觉：转置卷积

『计算机视觉』SSD源码学习_基于TensorFlow（待续）

计算机视觉处理的三大任务（待续）

二、计算机视觉与卷积神经网络

卷积神经网络在计算机视觉中的演进

『计算机视觉』深度可分离卷积

计算机视觉与卷积神经网络

计算机视觉——全卷积网络（FCN）的学习笔记

计算机视觉中的各种卷积(Convolution in Computer Vision)

计算机视觉之卷积神经网络原理

计算机视觉的核心——CNN卷积神经网络

计算机视觉 - 理论 - 从卷积到识别

计算机视觉:卷积层的参数量是多少？

计算机视觉：卷积核的参数是如何得到的？

计算机视觉：多通道卷积操作

计算机视觉-卷积神经网络

计算机视觉：深层卷积神经网络的构建

计算机视觉

计算机视觉~~~

[PaddlePaddle] [学习笔记] [上] 计算机视觉（卷积、卷积核、卷积计算、padding计算、BN、缩放、平移、Dropout）

『计算机视觉』Mask-RCNN_训练网其一：如何训练自己的数据（待续）

『计算机视觉』Mask-RCNN_从服装关键点检测看KeyPoints分支（待续）

『计算机视觉』超分辨率重建技术整理（待续）

2024年基于计算机视觉，深度学习卷积神经网络计算机毕业设计选题

计算机视觉会议计算机视觉刊物

【计算机视觉】几个计算机视觉库

遇到的计算机日语总结（待续）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)