faster rcnn中Roi pooling层的个人理解 - 代码天地

faster rcnn中Roi pooling层的个人理解

其他 2018-05-30 16:37:38 阅读次数: 0

每次看Faster rcnn的paper都能收获到不少东西，所以这个博客的目的就是为了记录自己看这篇paper的过程中的一些理解。

本文为自己根据大家的博客的内容摘取和自己的理解汇合完成：

Faster rcnn的整体构架：

训练的大致过程：

1、图片先缩放到MxN的尺寸，之后进入vgg16后得到（W/16，H/16）大小的feature map；

2、对于得到的大小为（W/16，H/16）的feature map上的每一个位置，都生成三种比例、三种（rotio、scale）尺度的anchors，Anchor即给出一个基准窗大小，按照倍数和长宽比例得到不同大小的窗。例如论文中基准窗大小为16，给了（8、16、32）三种倍数和（0.5、1、2）三种比例，这样能够得到一共9种尺度的anchor。

因此，在对60*40的map进行滑窗时，以中心像素为基点构造9种anchor映射到原来的1000*600图像中，映射比例为16倍。那么总共可以得到60*40*9大约2万个anchor；

3、每个anchor经过回归后对应到原图，然后再对应到feature map经过roi pooling后输出7*7的大小的map；

4、最后对这个7*7的map进行分类和回归。

Roi pooling层详解：

Roi pooling层也是pooling层的一种，只是是针对于Rois的pooling操作而已。

Roi pooling层的过程就是为了将proposal抠出来的过程，然后resize到统一的大小。

Roi pooling层的操作如下：

1、根据输入的image，将Roi映射到feature map对应的位置；

2、将映射后的区域划分为相同大小的sections（sections数量和输出的维度相同）；

3、对每个section进行max pooling操作；

（参考：https://blog.csdn.net/auto1993/article/details/78514071）

猜你喜欢

转载自blog.csdn.net/gbyy42299/article/details/80352418

faster rcnn中Roi pooling层的个人理解

ROI Pooling在Faster-RCNN中的应用理解

Faster Rcnn ROI Pooling层解析 ROI Pooling层解析

Faster RCNN系列5——RoI Pooling与全连接层

faster RCNN(keras版本)代码讲解(6)-ROI Pooling层详情

Faster RCNN中RPN理解

RCNN Faster RCNN 理解

Faster rcnn代码理解

faster rcnn理解

Faster-RCNN理解

faster-rcnn中，对RPN的理解

faster rcnn中anchor的生成过程理解

faster-rcnn中添加Mask中的RoiAlign层，使回归框更精确（ roi_align_layer.cu:240] Check failed: error == cudaSuccess *）

R-CNN、FAST-RCNN 、FASTER-RCNN详解（包括SS，Bbox回归，RPN，RoI Pooling）

Faster RCNN系列4——生成Proposal与RoI

转载Faster-rcnn理解

Faster RCNN代码理解（Python）

Faster rcnn源码理解（4）

Faster rcnn源码理解（3）

Faster rcnn源码理解（2）

Faster RCNN论文理解

理解ssd yolo faster rcnn

faster - RCNN 原理理解

faster-rcnn中添加Mask中的RoiAlign层，使回归框更精确（ roi_align_layer.cu:240] Check failed: error == cudaSuccess *） 2.如何在caffe中自定义网络层

Faster-Rcnn中RPN（Region Proposal Network）的理解

faster rcnn中rpn的anchor，sliding windows，proposals的理解

关于Faster-Rcnn中的AnchorBox的一些理解

faster rcnn 中核心部分RPN网络的整理与理解

从RCNN到faster-RCNN的理解

【目标检测】Mask RCNN中：ROI Align和ROI Pooling的具体区别？

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)