【论文阅读】【3D目标检测】PV-RCNN++

论文:PV-RCNN++: Point-Voxel Feature Set Abstraction With Local Vector Representation for 3D Object Detection

PVRCNN的作者又放出了PVRCNN++,主要在效率上做了改进。

PV-RCNN++

本文首先介绍了PVRCNN,然后基于PVRCNN的框架介绍了PVRCNN++的改进。PVRCNN就不介绍了,可以详见另一篇博客

PVRCNN速度慢主要是慢在了point-based network这个部分。PVRCNN对做了如下改进。

SPC

FPS比较慢,因为FPS是 O ( n 2 ) O(n^2) O(n2)的时间复杂度。并且FPS是覆盖了整个场景的采样,大量的点会采在背景点上。所以作者提出SPC:第一步是用预测的proposal选出靠近物体的点,从而降低点的数量;第二步是将整个场景以激光雷达为原点,按角度分成多份,每个角度内,再用FPS。
在这里插入图片描述
通过减少FPS输入点的数量,来降低FPS的计算时间。而且使得选出来的key point都在物体附近

VectorPool aggregation

SA另外慢还慢在了要做radiusNN,而且SA用的MLP会丢失相对位置关系。所以作者提出了VectorPool的操作,如下图:
在这里插入图片描述
对于一个key point,在其周围构建一个voxel,然后对每个格子内的点做平均,然后用一个MLP做特征提取,然后把每个格子的特征拼接起来。

KITTI上报告的运算速度是每帧0.06s,感觉也已经很高了。

猜你喜欢

转载自blog.csdn.net/wqwqqwqw1231/article/details/113923665