学习笔记:自动驾驶中CV的应用

文章 基于计算机视觉的自动驾驶算法研究综述

一传统CV的自动驾驶任务

1 道路与车道线识别

道路与车道识别是自动驾驶技术的基础内容,如 Caltech lane detector[1] 中论述。常见的道路的识别算法基于图像特征进行计算,其分析图像中表示车道线或道路边界等的灰度,颜色,纹理等特征,通过神经网络、支持向量机、聚类分析和区域生长等方法便可以分割出路面区域。这类方法对道路曲率的变化有很好的鲁棒性。[2]中提出了基于直方图统计方法,[3]中提出了一种通过灭点分析进行路面检测的方法,均取得了不错的效果。最近基于条件随机场的道路检测方法取得了重要的进展,例如[4,5],由于道路及边沿的种类繁多,纷杂的车辆以及路边杂物的遮挡,树木以及建筑物的阴影干扰等,使得最基本的道路检测存在
需要进一步提升的空间。

2 车辆检测技术

车辆检测技术为自动驾驶领域研究的热点之一。前向车辆碰撞预警系统是一种有效降低主动事故发生率的技术,其广泛采用车辆定位的方法实现[6],可以利用车辆自身的图像特征,如阴影、对称性、边缘等,例如常用的底部阴影以及车辆的两个纵向边缘构成的 U 型特征等,快速定位车辆感兴趣的区域,再利用多目标跟踪算法[7]对检测的车辆进行跟踪。

3 行人检测及防碰撞系统

以“行人保护”为目的的行人检测及防碰撞系统也成为自动驾驶领域的研究热点。目前统计学习方法在行人检测中应用最为广泛,特征提取和分类定位是基于统计学习方法的两个关键问题。基于统计学习的行人检测主要包含基于生成式模型( 局部) 的检测方法和基于特征分类( 整体) 的检测算法。基于生成式模型的检测方法通
常采用局部特征或者肢体模型来描述局部属性,结合局部特征的空间结构特性或分布模型进行分类,其主要代表有[8 - 10]。基于特征分类的检测方法目的是找到一种能够很好地描述行人特征的方法。通过提取行人的灰度、边缘、纹理、颜色等信息,根据大量的样本构建行人检测分类器,从样本集中学习人体的不同变化,把视频图像中的行人目标从背景中分割出来并精确定位。2005 年 Dalal 提出梯度直方图( Histogram of Oriented Gradient,HOG) [11]是一个最基本的特征,具有非常强的鲁棒性,其他很多行人检测的算法都是在使用HOG 的基础上,加上其它特征,如尺度不变特征转换( Scale - invariant Feature Transform,SIFT) 、局部二值模式( Local Binary Pattern,LBP) 、颜色自相似( Color Self - Similarity,CSS) 、多通道等等,其主要代表有[12,13]。Cheng 等人观察到物体都有闭合边缘,基于 HOG 特征提出了一种二进制归一化梯度特征( BING) 来预测显著性窗口的方法[14],该方法运行速度非常快,可以达到 300fps。赵勇
等在 HOG 的基础上提出了一个具有较好的尺度不变特征 eHOG[15],将 HOG 中梯度直方图中每个bin 的特征重构成一个位平面,再计算其 HOG 特征,实验表明,在计算量没有大幅度增加的情况下,正确率比原 HOG 高 3 - 6 个百分点。HOG 特征存在一个问题,即整个 HOG 特征被拉长成一个矢量,弱化了原来在二维平面局部空间的梯度特征之间的局部关联特性。张永军等人提出的 I -HOG[16]采用多尺度的特征提取算法和构建梯度直方图之间的关联,增强了行人边缘信息在二维平面空间的局部关联,I - HOG 特 征 相 较 于 原HOG 特征较大幅度的提高了检测率[17]。SIFT 是一种检测局部特征的算法[18],该算法通过求一幅图中的特征点及其有关尺度和方向的描述得到特征并进行图像特征点匹配,用于检索或者标准图库类别的识别时,其不仅具有尺度不变性,即使改变旋转角度,图像亮度或拍摄视角也能够得到非常好的检测效果。

二、深度学习方法

深度学习有多个常用模型框架,如自动编码器、稀疏编码、限制波尔兹曼机、深信度网络、卷积神经网络等
自动驾驶加测目标繁多,包括前方机动车、非机动车、行人、道路标识、道路本身、车道线等等,导致基于目标监测与识别的学习算法变得十分复杂

1 自主学习人员驾驶–深度驾驶算法

在自动驾驶与机器人导航中,另一种方法直接从视频图像中学习前进方向的角度来寻找路径和绕开障碍
物[37,38],以及 Yann Lecun 的工作[39,40],即通过端到端学习,以实现非道路上的障碍物避让,使用 6层的 CNN 学习人的驾驶行为,可以在穿越视野内区域的同时学习低层和高层特征,消除人工的校
准、矫正、参数调整等等,该系统主要的优点是对各种不同环境下的非道路环境有非常好的鲁棒性。

以上工作均为通过深度学习直接将图像映射到行驶的角度下进行的。在这一思想的影响下,在 ICCV2015 上,普林斯顿大学提出了深度驾驶算法[41],其算法架构如图 1 所示,通过深度神经网络直接感知驾驶操控( driving affordance) ,不仅大大简化了算法的复杂度,而且大大提高了自动驾驶的鲁棒性和智能化水平,是自动驾驶技术上的一个重大突破。深度驾驶的技术,通过采用 CNN 来直接学习和感知一段时间正确驾驶过程以后,就能学习和感知到实际道路情况下的相关驾驶智能,无需通过感知具体的路况和各种目标,大幅度提升了辅助驾驶算法的性能。
在这里插入图片描述

原创文章 101 获赞 9 访问量 8374

猜你喜欢

转载自blog.csdn.net/weixin_44523062/article/details/106032778