深度学习模型相关知识(2)

参考:https://blog.csdn.net/lanran2/article/details/60143861

ROI pooling:

ROI是Regin of Interest的简写,指的是特征图上的框,特点在于输入特征图尺寸不固定,但是输出特征图尺寸固定。

这里加一个Fast RCNN和Faster RCNN在ROI步骤前的区别:

1)在Fast RCNN中,RoI是指Selective Search产生的候选框在特征图的映射

2)在Faster RCNN中,RoI是由RPN产生的候选框在特征图的映射

如上为Fast RCNN的整体结构,经过提取候选框后完成在feature map上的映射,再经RoI pooling来将多个不同尺寸的RoI统一到相同的尺寸,然后再提取特征。

RoI pooling的输出:

输出的是batch个vector,其中batch的值是在上面的例子中是单个给定像素图中RoI的个数,vector的大小为channel*w*h(这里的channel也就是上面红色小矩阵的厚度),也就是说RoI Pooling的过程就是将大小不同的box矩形框,映射成固定大小(w*h)的矩形框。

猜你喜欢

转载自www.cnblogs.com/xiaochouk/p/9079461.html