R-FCN 论文学习

R-FCN: Object Detection via Region-based Fully Convolutional Networks

论文地址: https://arxiv.org/pdf/1605.06409v2.pdf.

Abstract

作者使用R-FCN (region-based,fully convolutional networks)进行精确和有效的目标检测。对比之前的区域检测器(Fast/Faster R-CNN 应用于每一个区域子网格要花费数百次),我们的区域检测是基于整幅图片的全卷积计算。作者使用了一个 position-sensitive score maps 来处理在图像分类中的平移不变性和在目标检测中的平移变换性这样一种两难境地。作者的方法采用了全卷积图片分类主干部分,例如最新的残差网络(Residual Networks) (ResNets),用于目标检测。在PASCAL VOC(e.g.,83.6% mAP on the 2007 set) 数据集的实验上,作者使用了101层的 ResNet 达到了很好的效果。同时仅仅使用了170ms/每张图片,比Faster R-CNN匹配快了2.5~20倍左右。

1. Introduction

目标检测领域的深度网络,在 Region of Interest(RoI) 池化层前后可被分为两个子网络:

  • 一个是共享的,全卷积且独立于 RoI 的子网络;
  • 一个是 RoI-wise 且不共享计算的子网络,由若干全连接层组成;
    比如 ALexNet 和 VGG Net 一般来说,都是先经过一系列的卷积层,每层卷积以后会有一些池化层,最后跟着若干全连接层。Fast R-CNN,SPPnet就是卷积层后跟着 SPP 或者 RoI 池化层,然后再有全连接层。

猜你喜欢

转载自blog.csdn.net/calvinpaean/article/details/84067113
今日推荐