PIXOR: Real-time 3D Object Detection from Point

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/lpj822/article/details/86711547

PIXOR: Real-time 3D Object Detection from Point

简介

LiDAR方法最精准安全,但LIDAR每扫一圈要产生10^5个无规则点,对现在的探测器是很大的挑战。
主要解决方法是将点云结构化从而可以使用标准卷积操作,结构化方法大致分为以下两类:

  1. 3D voxel grid 由于三维点云被自然分割,体素网格非常稀疏,因此大量的计算是冗余的。
  2. 2D projections 有RV和BEV两种,他它们在投影和离散的过程中造成了信息的损失,MV3D方法试图融合2D投影和相机图像,但计算代价过高,无法应用到实时应用中。

这篇论文提出了PIOXR方法,我们选用BEV是因为同三维体素网格比起来,它计算更友好,保留了度量空间,让模型可以先探索物体分类的尺寸和形状。

3D目标检测整体框架

在这里插入图片描述

数据输入

三维体素网格方法计算量很大,因为需要让三维卷积核在三个维度进行卷积。本论文只使用BEV,将三维降至二维,但我们仍然留有高度信息,就像RGB图的三个通道一样。我们可以得到更紧凑的表达,只要我们对BEV信息使用二维卷积,因为所有的车辆都是在同一水平面上的。BEV还有一个优点,当待检测物体没有重叠时,我们可以知道物体的物理维度信息阐述BEV投影和离散过程:结合三维张量和二维图片反射: L d L × W d W × ( H d H + 1 ) \frac{L}{d_L}\times\frac{W}{d_W}\times(\frac{H}{d_H}+1)

网络框架

在这里插入图片描述

loss

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/lpj822/article/details/86711547
今日推荐