论文解读--Efficient L-Shape Fitting for Vehicle Detection Using Laser Scanners

摘要

        对周围车辆的检测是自动驾驶的一项重要任务,近年来备受关注。在使用激光扫描仪时,L-Shape拟合是基于模型的车辆检测和跟踪的关键步骤,需要深入调查和全面研究。在本文中,我们将L-Shape拟合作为一个优化问题。在此基础上,提出了一种高效的基于搜索的最优解求解方法。我们的方法不依赖于激光扫描序列信息,因此支持多个激光扫描仪方便的数据融合;它是高效的,涉及很少的参数调优;该方法也灵活,以适应不同的拟合标准的各种拟合需求。产品级激光扫描仪的道路实验已经证明了我们的方法的有效性和鲁棒性。

1.简介

        自动驾驶在文献[1]-[5]中得到了广泛的研究。在[6]、[7]自动驾驶中,周围物体的检测是一项必不可少的任务,其中光探测测距(LIDAR)传感起着重要作用。激光扫描仪被广泛应用于周围环境的感知,因为传感器能够高精度地测量其到周围物体表面的距离。处理范围数据的典型方法是将范围数据分割为点簇,从中提取线段、块和矩形等有意义的特征[8]。这些特征很有意义,因为它们与现实世界中的墙壁、自行车、树林、灌木丛、车辆和行人等物体相对应。然后,这些特征与静态地图或跟踪目标相关联,并通过跟踪方法(如多假设跟踪(MHT)[10],[11]或其集成了Rao-Blackwellized粒子滤波器(MHT- RBPF)[12],[13])来更新目标状态。

        尽管在完全自动驾驶到来之前还有很多工作要做,但半自动驾驶已经开始,并将在不久的将来广泛推广。例如,自适应巡航控制系统和碰撞预警系统已经被引入高端豪华汽车。所有这些半自主系统都高度依赖于对移动车辆的检测和跟踪,其作用非常重要,值得进一步研究和深入探索。

        本文主要研究利用激光距离数据进行L-Shape拟合的车辆跟踪。L-Shape拟合非常重要,因为它为车辆检测和跟踪提供了数据,这是实现自动驾驶的关键组件。L-Shape拟合需要鲁棒性和正确性,否则可能会误导目标跟踪,甚至造成事故。L-Shape拟合还需要计算效率高,以便能够实时完成许多依赖于它的高级估计和决策任务。

        在本文中,我们提出了一种基于搜索的L-Shape拟合方法,用于从激光数据中检测车辆,该方法计算效率高。通过生产级传感器的道路实验,证明了该方法的有效性和效率。论文的其余部分组织如下:相关研究工作概述在第二节中描述。第三节介绍了所提出的基于搜索的L-Shape拟合方法。第四节给出实验结果,根据实验结果得出第五节的结论。

2.相关工作

        卡内基梅隆大学的格子赛车队在2007年凭借自动驾驶汽车“BOSS”赢得了DARPA城市挑战赛。这场开创性的比赛是在低密度、低速交通的城市环境中举行的,在这种环境中,自动驾驶汽车需要执行复杂的机动,如合并、通过以及与有人和无人车辆交通的交互。在比赛中,由于使用了高清3D激光雷达传感器,例如位于“Boss”顶部的Velodyne HDL-64传感器,使得路缘检测和汽车跟踪成为可能。这种高清3D LIDAR传感器提供的3D点云,与车内其他传感器一起,密度足够大,可以让“Boss”通过静态地图生成和运动物体跟踪[14],清楚地了解周围环境。然而,高清3D激光雷达传感器非常昂贵,仍然不能在量产车辆上普遍使用。

        卡内基梅隆大学的新凯迪拉克SRX研究平台[15]尝试使用产品级传感器,如激光雷达、雷达和相机。这些传感器不仅为降低设备支出提供了一种潜在的替代解决方案,而且由于这些传感器都隐藏在汽车中(见图1),使得公众看起来熟悉的车辆外观整洁。然而,放弃高清3D LIDAR传感器及其密集的距离点,对自动驾驶汽车的感知任务提出了重大挑战。从基于激光的距离传感中,我们只能检测到物体轮廓中面向传感器的部分。遮挡使这个问题更加困难,因为距离传感器可能无法完全观察到物体的轮廓。为了解决这些问题,一种提取目标几何特征的车辆形状模型被广泛应用于特征提取和姿态估计。在二维距离数据中,常用的车体形状模型为L形、方框和两条垂线[16]、[17]。不完全轮廓拟合的车辆形状模型可以很容易地提取出目标跟踪的特征。

图1:CMU自动驾驶汽车研究平台“SRX” 

        在车辆形状模型的基础上,提出了多种拟合方法。在[9]中,在距离点上应用主成分分析(PCA)来提取可能对应于汽车边缘的最重要的轴。比较连续循环中的姿势也有助于找到目标的前进方向。在[16]中,采用加权最小二乘方法去除异常值,将不完整轮廓拟合到矩形模型中。考虑到遮挡问题,在[16]中同时进行了直线拟合和直角角拟合,只有当角拟合明显优于直线拟合时才选择角拟合。在[17]中,利用距离点的排序,即扫描序列的信息,有效地将点分割成两个不相交的集合,然后分别由两个点集合拟合出两条正交直线,分别对应于汽车的两条边;按照扫描序列迭代所有这些二维范围点,该算法搜索一个枢轴点,并使用这个枢轴点得到两个不相交的集合,即在枢轴点之前扫描的点集和在枢轴点之后扫描的点集。

        这些方法在某些情况下已经证明了它们的有效性,但仍有一些局限性。与现有方法相比,本文主要有三个方面的贡献。首先,我们的方法不依赖于激光扫描序列信息,因此很容易实现来自多个传感器的数据融合,这使得它适用于多个生产级传感器的应用。其次,我们的方法计算效率高,涉及的参数很少,不需要实际经验或参数调优。第三,我们的方法能够适应任何指定的标准,这使得方法灵活地适应不同的拟合要求,并可扩展为各种应用。

3.基于L-Shape的车辆检测

        在获得激光距离数据后,我们首先对数据点进行聚类。这些集群通常对应于自行车、行人或车辆,可以分为[9]、[18]等类别。在本文中,我们只对车辆的l型装配感兴趣。假设车辆模型为l型,即矩形,对于每个分割的点簇,我们首先根据预先设定的准则寻找最佳矩形方向,然后得到沿该方向并包含该分割中所有点的拟合矩形。

A.分割

        分割算法如Alg1所示,其基本思想是将距离点按照预先设定的距离阈值进行聚类。分割的输入是n个范围扫描点的二维坐标,,它相对于我们无人驾驶汽车的后差速器。该算法的输出是一组分段聚类,每个聚类潜在地对应于现实世界中的一个对象。主要程序是,对于每个扫描点,我们使用K-D树在距离r内找到它的相邻点,然后将它们组合成一个聚类;然后我们找到在r距离内的点,这些点与聚类中已经存在的点的距离不超过r,然后再次将新找到的点放在这个聚类中;我们重复这个过程,直到集群不再增长,这个最终的集群作为输出中的一个分段。该算法确保我们只对每个点运行一次范围搜索。

         请注意,分割算法是自适应的,因为距离搜索阈值r与点与激光传感器之间的距离成正比(Alg. 1中的第8行)。这是由激光扫描经度分辨率随着距离距离的增长而增长的基本事实所证明的。此外,只要范围点的扫描排序索引可用,距离搜索函数就可以使用此信息来加快该过程。在像我们这样没有扫描序列的情况下,K-D树数据结构可以用于在这个2-D低维空间中进行有效的范围搜索。

B.L-Shape拟合

        使用L-Shape矩形模型假设,对于每个分割的点簇,我们希望找到最适合这些点的矩形。评价拟合性能的一个经典准则是最小二乘,它涉及到以下优化问题:

(1)

         其中,我们通过寻找最佳析取(P, Q分割m点{(xi, yi)|i = 1,…, m}分为两组))来最小化角拟合的平方误差。和分别对应于P和Q中的点的两条垂直线的最优参数(θ, c1, c2) -这两条直线的表达式是x cos θ + y sin θ = c1和- x sin θ + y cos θ = c2。然而,由于划分问题的组合复杂性,上述优化问题很难解决。

        由于准确地解决上述优化问题在这个实时应用中是不切实际的,因此我们依靠基于搜索的算法来近似地找到最适合的矩形。基本思路是我们遍历矩形的所有可能方向;在每次迭代中,我们可以很容易地找到一个面向该方向并包含所有扫描点的矩形;因此,可以得到所有点到矩形四条边的距离,并根据这些距离将点分为P和Q,并计算相应的平方误差作为(1)中的目标函数;在迭代所有方向并获得所有相应的平方误差后,我们寻找实现最小平方误差的最优方向,并根据该方向拟合矩形。一旦得到这个拟合矩形,就可以很容易地提取车辆跟踪的特征。

        该算法在Alg. 2中给出。算法的输入是这个分割中的m个点,。该算法的输出是拟合矩形四条边的直线表示。矩形的可能方向θ范围从0◦到90◦,因为矩形的两边是正交的,我们只关心落在0◦和90◦之间的单边;另一个方向就是θ + π/2。θ的搜索空间可以在跟踪系统或视觉场景理解的支持下缩小。如果边的线表示形式为ax + by = c,则四条边的参数可以通过Alg. 2中的步骤12到15轻松获得。

         最小化平方误差是拟合和回归中常用的准则,但在车辆拟合中也可能有其他适用的准则。Alg. 2中的标准是一个性能分数,它反映了矩形与范围点的拟合程度。该标准可以以多种方式定义,每种定义都可能有其优点和缺点。我们考虑了选择矩形的三个标准:矩形面积最小化、点与边的接近度最大化和点与边的平方误差最小化,分别在Alg. 3、4和5中提出。这三个函数中的每一个都可以被选择来扮演Alg. 2中的CalculatecriterionX函数的角色。所有这些准则计算函数都以C1和C2为输入,C1和C2是由θ决定的两条正交边上所有范围点的投影。

        利用Alg. 3中的面积最小化准则,寻找覆盖所有距离点的最小矩形;这类似于[19]中使用的拟合方法。通过使用Alg. 4,我们强调这些范围点与右角的两个边缘有多近。在投影的二维平面中,为所有点在轴上的边界,向量−c1和c1−记录所有点到这两个边界的距离;从两个边界中选择一个距离距离较近的边界,并将其对应的距离向量记为D1;距离向量D2的定义类似于投影轴。亲密度评分定义为Σ(1/di),i=1,…,m,其中di是第i个点到其最近边的距离。这样,减少扫描距离和增加扫描点的数量都可以获得更高的分数。注意,这里有一个最小距离阈值d0,以避免(1)边界上的点除以0,以及(2)非常接近边缘的点的戏剧性投票权。利用Alg. 5,我们强调了两个不相交的点组拟合的两条正交边的平方误差。E1包含分配给的点到边界的距离,而E2包含分配给的点的距离。E1的方差实际上等于一条直线沿θ方向相对于属于E1的点的误差的平方。因为在计算平方误差时,我们本质上是在计算这些距离的方差,这个准则也被称为“方差”。回想一下,通过使用这个方差准则,我们实际上是在寻找(1)中优化问题的近似解。

4.实验结果

        本节给出了实验结果,以评估我们提出的算法的正确性和效率。实验是在CMU的自动驾驶汽车SRX(图1)上在当地道路上进行的。六个IBEO被安装,提供多层范围扫描。注意,这里的实验没有使用扫描序列/排序信息。

A.计算效率

        通过在当地道路上收集约10,000次激光扫描的实验,证明了该算法的计算效率。每次激光扫描被分割成簇(总共约25000个簇),并对每个簇进行基于搜索的拟合算法。计算时间如表1所示。算法在MATLAB中实现,运行在配备Intel Core i7 CPU的Linux笔记本电脑上。方差最小化准则是最耗时的,因为计算方差需要大量的计算,平均每个聚类大约需要3.84 ms。如果用更高效的编程语言实现,算法的计算性能将会更好。请注意,计算时间的标准偏差非常小,这是有益的,因为这表明了对高级决策任务计算时间的一致估计。

表1 矩形拟合计算时间

B.矩形拟合

        使用这三种准则的典型矩形拟合示例如图2所示。在图2(a)中,三种准则拟合的矩形基本相同;图2(b)显示了搜索方向上对应的归一化准则,其中三条曲线的极大值都在θs附近。在图2(c)中,面积最小化准则得到了不准确的矩形标题,而其他两个准则几乎相同。一个由145个点簇组成的数据集,即145辆车的激光距离点,其标题以分辨率1◦处被手动标记,用于测试所提出方法的正确性。接近度最大化准则和方差最小化准则都有很高的正确性,而面积最小化准则有时会出错。区域最小化准则的性能只有在分割中的范围扫描点密度较高时才能保证,例如在拟合一个小物体的情况下或当使用更强大的传感器如Velodyne[19]时。使用三个准则和主成分分析的航向误差直方图如图3所示,其中航向误差定义为我们的方法产生的航向减去地面真值的航向。实际误差(即航向误差)和绝对误差的均值和标准差如表2所示,其中实际误差的均值表示估计偏差,绝对误差的均值表示估计精度(不考虑方向误差的平均幅度)。如表2所示,对于接近度和方差准则,真实误差和绝对误差都很小。

         图2:矩形拟合示例。在(a)和(c)中,灰点表示激光范围扫描点,绿色、红色和蓝色的矩形是通过使用标准面积最小化、接近度最大化和方差最小化来拟合的矩形。这三个标准在搜索方向上的标准化分数分别在(b)和(d)中绘制。在例子(a)中,三个标准的拟合结果非常相似,(b)中三条曲线的最大值非常接近(用箭头标记,分别为88◦、89◦和0◦)。在例子(b)中,面积标准的拟合结果与其他两个不同,其在(d)中的最大值远离其他两个(分别在69◦、1◦和86◦处实现)。

 图3 角度误差直方图

表2 矩形拟合角度误差

        两种典型周期的结果如图4所示。图4(a)中分散的5辆车在图4(b)中拟合得很好,图4(c)中穿过十字路口的3辆车在图4(d)中拟合得很好。汽车的位置由坐标(0,0)处的黑色菱形表示。注意,在实现中忽略小于10个范围点的小集群。

        图4:典型激光扫描周期的分割和车辆拟合结果。这两个周期的照相机视图显示在(a)和(c).中在(b)和(d)中,分割后的激光扫描点用不同颜色和形状的标记表示,通过标准接近度和方差表示的车辆拟合结果分别用红色和蓝色的矩形表示。

        图5给出了该方法没有实现良好性能的罕见情况的示例。在图5(b)中,接近度判据(红色矩形)由于L-Shape外的点对车辆方向产生了误解,这些点来自图5(a)中白色SUV侧镜的扫描点;在图5(e)中,分散在车辆下部的点破坏了方差准则,这些点来自于卡车的后窗。这里的缺陷的根本原因是,假设的L-Shape车辆模型并不适用于这两个例子,要么是因为L-Shape外的侧镜,要么是因为L-Shape内的后窗。请注意,这些不完美的情况非常罕见,它们对车辆跟踪的影响非常有限,因为拟合结果总是在其连续的周期中进行修正,如图5(c)和图5(d)所示。在这些罕见的情况下,当其中一个标准被破坏时,另一个标准会给出正确的矩形拟合。

        图5:L-Shape模型假设不成立的情况。对于(a)中的白色SUV,(b)和(c).显示了分段激光扫描点和矩形拟合结果,连续两个周期对于(d)中的卡车,在(e)和(f)中显示了连续两个循环中的扫描点和拟合结果。在(b)中,红色的接近标准被黑色箭头所示的侧镜所危害。在(d)中,蓝色的方差准则受到卡车后窗的影响。请注意,即使对于这两种罕见情况,两种准则中至少一种都很好,拟合结果将在下一个周期中得到修正

5.结论

        提出了一种基于搜索的激光距离数据L-Shape拟合方法。所提出的方法不依赖于扫描序列/排序信息,能够融合来自多个激光扫描仪的原始激光数据;该方法计算效率高,易于实现,涉及很少的参数,不需要实际操作经验或参数调整;它能够适应任何指定的标准,这使得该方法可以灵活地满足不同的拟合要求,并可扩展到各种应用。本文讨论了三个标准,并在实验中进行了比较。使用量产级传感器的道路实验表明,即使在L-Shape模型假设不成立的情况下,例如激光扫描带有大后视镜的SUV,所提出的方法也是有效和鲁棒的。车辆航向估计的平均绝对误差可低至1.55◦。在我们未来的工作中,我们将把提出的L-Shape拟合方法纳入到一般的车辆跟踪算法中。

猜你喜欢

转载自blog.csdn.net/weixin_41691854/article/details/130012518