RoI pooling layer解读 - 代码天地

RoI pooling layer解读

其他 2019-02-26 22:57:34 阅读次数: 0

ROI pooling作用有两点：
（1）根据输入image，将ROI映射到feature map对应位置，映射是根据image缩小的尺寸来的；
（2）将得到的RoI映射在feature map上得到的RoI feature region输出统一大小的特征区域（由于区域提议得到的RoI大小和尺度比例不尽相同，无法输入FC层进行一维化操作）

ROI pooling layer具体操作

1. 根据输入image，将ROI映射到feature map对应位置

2. 将映射后的区域划分为相同大小的sections（sections数量与输出的维度相同）

具体过程：假设我们输入的RoI的尺寸大小为H x W，而我们经过RoI pooling layer操作后需要得到的统一尺寸大小为h x w，则有以下几步过程：

1）输入的H x W需要被划分成h x w个网格块，然后对每个块进行max pooling操作；

2）那么重要的是每个块需要被划分为多大的像素呢？采用平均分块得到每个块的像素尺寸大小为，但此时又存在问题，如果除不整呢？解决方法是除不整舍去小数保留整数，而最后一个行块或列块包含剩余没有包括在内的元素值。具体看下面的例子。

3. 对每个sections进行max pooling操作

这样我们就可以从不同大小的方框得到固定大小的feature maps

一个例子

考虑一个8*8大小的feature map，一个ROI投影后大小为5 x 7，以及输出大小为2 x 2

1. 输入固定大小的feature map

2. region proposal投影之后的位置（左上角（0，3），右下角坐标（7，8）），大小为5 x 7

3. 将其划分为2*2个sections（因为输出大小为2*2）

此时5/2 = 2.5，7/2 = 3.5，都除不整，则左上角第一个块的大小即为2 x 3，第一行右上角的块的大小即为2 x （7-3）= 2 x 4，

第二行第一列即为（5-2）x 3 = 3 x 3，最后一个块则为（5-2）x（7-3）= 3 x 4。

4. 对每个section做max pooling

猜你喜欢

转载自blog.csdn.net/xunan003/article/details/86583563

RoI pooling layer解读

关于ROI Pooling Layer的解读

ROI pooling的最完美解读

Pytorch中RoI pooling layer的几种实现

ROI Pooling

RoI pooling、RoI Align

RoI Pooling与RoIWrap Pooling与RoIAlign Pooling与Precise RoI Pooling

【ROI Pooling】ROI Pooling层详解（转）

roi pooling， roi align等区别

ROI Pooling层详解

ROI Pooling的详细解释

Roi-Pooling学习

RoI Pooling详解

关于RoI pooling 层

ROI Pooling层解析

学习ROI Pooling层

【转】ROI Pooling

ROI Pooling 复习

ROI pooling 解释

Roi pooling 和 RoiAlign

普通max pooling反向传播与RoI max pooling反向传播解读

ROI (Region of interest pooling) Pooling 层详解

详解ROI Pooling和ROI Align

Faster Rcnn ROI Pooling层解析 ROI Pooling层解析

RPN和ROI pooling的理解

目标检测-ROI Pooling介绍

Roi Pooling，Roi Warping pooling，PSROIPooling，Roi Align，PrROI Pooling大总结

ROI POOLING层的原理及代码分析

【ROI Pooling】Caffe版源码解析

ROI pooling的一系列介绍

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)