版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
PIXOR: Real-time 3D Object Detection from Point
简介
LiDAR方法最精准安全,但LIDAR每扫一圈要产生10^5个无规则点,对现在的探测器是很大的挑战。
主要解决方法是将点云结构化从而可以使用标准卷积操作,结构化方法大致分为以下两类:
- 3D voxel grid 由于三维点云被自然分割,体素网格非常稀疏,因此大量的计算是冗余的。
- 2D projections 有RV和BEV两种,他它们在投影和离散的过程中造成了信息的损失,MV3D方法试图融合2D投影和相机图像,但计算代价过高,无法应用到实时应用中。
这篇论文提出了PIOXR方法,我们选用BEV是因为同三维体素网格比起来,它计算更友好,保留了度量空间,让模型可以先探索物体分类的尺寸和形状。
3D目标检测整体框架
数据输入
三维体素网格方法计算量很大,因为需要让三维卷积核在三个维度进行卷积。本论文只使用BEV,将三维降至二维,但我们仍然留有高度信息,就像RGB图的三个通道一样。我们可以得到更紧凑的表达,只要我们对BEV信息使用二维卷积,因为所有的车辆都是在同一水平面上的。BEV还有一个优点,当待检测物体没有重叠时,我们可以知道物体的物理维度信息阐述BEV投影和离散过程:结合三维张量和二维图片反射: