【mmdetection】— 可视化 NMS 前后的预测框

1.NMS

NMS(Non-Maximum Suppression),即非极大值抑制,是 anchor based 目标检测算法中必不可少的一步,其目的是**抑制掉指向同一个目标的其他得分较低的预测框,只保留得分最高的预测框。简单来说,就是筛选出一定区域内属于同一种类的得分最大的框。
nms
如上图所示,右下图到左下图,即分别为 NMS 前、后的预测结果图片。(图片来源于网络)

2.NMS步骤

(1)对目标的种类进行循环,依次对每一个类分别进行非极大值抑制;
(2)对于某一类别,根据 score 得分进行从大到小排序。
(3)每次取出得分最大的框,计算其与其它所有预测框的 IOU,IOU 大于阈值(一般设置为0.5)的则剔除。
核心代码实现为:
按照 score 降序排列 bboxes,集合定义为 F;
定义一个 keep 变量;
当 F 不为空时,执行以下循环:将 F 中得分最高的bbox放入 keep 中;计算该 bbox 与剩下所有bboxes 的 IOU,保留 IOU 小于阈值的 bboxes;更新 F;
当 F 为空时,返回 keep,即为 NMS 后的预测框(bboxes)。

3.可视化

在知道了 NMS 原理的基础上,我们想具体看一下 NMS 的功能效果,以及在自己数据集的表现如何,该怎么办呢?其实也很简单。
首先,打开**configs/base/models/faster_rcnn_r50_fpn.py,**如下图可以看到:
nms

nms
在 train 和 test 配置时候,共三处 NMS 过程。
mmdetectrion 框架中,利用 faster rcnn 进行训练时,涉及到 NMS 的有两个地方,三个过程:
①在mmdet/models/dense_heads/rpn_head.py中,231行在左右的 batched_nms 方法,消除RPN 过程中部分重复的proposal,在训练和测试过程中都会出现。
②另一个是在 /mmdet/models/roi_heads/bbox_heads/bbox_head.py 中,375行左右的 multiclass_nms 方法,返回测试时候预测框的NMS结果,只在测试时候出现
找到 NMS 代码位置之后,我们就可以对其结果进行可视化了。这里举例,test过程中的NMS后处理过程,具体代码如下。执行 test 命令就可以得到预测框情况了。很方便,不用重新训练。

nms
结果示例如下:
nms
如图,左图为 NMS 之前的预测框,数目为 1000 个;右图为 NMS 之后的预测框,也就是最终的预测结果,数目大大减小,且没有一对多的情况。所以,NMS对于 anchor based方法是非常非常重要的。
怎么样,是不是很简单?如果对你有帮助的话,点个赞把!让我看看有多少小伙伴在一起学习人工智障!hh!

猜你喜欢

转载自blog.csdn.net/weixin_46600060/article/details/125434978
NMS