【论文笔记】Occupancy-MAE: Self-supervised Pre-training Large-scale LiDAR Point Clouds with Masked Occupan

论文名称:Occupancy-MAE: Self-supervised Pre-training Large-scale LiDAR Point Clouds with Masked Occupancy Autoencoders
原文链接:https://arxiv.org/abs/2206.09900

这篇文章针对激光雷达感知任务标注困难且耗时的特点,提出一种针对激光雷达点云感知的自监督预训练方法Occupancy-MAE。该方法使用掩蔽占用自编码器( Masked Occupancy Autoencoders,MAE),可在大型无标签数据集上进行训练。

方法

在这里插入图片描述
  将激光雷达点云体素化后,使用距离感知的随机体素丢弃(由于距离越远点云越稀疏,丢弃概率需要设置得越小)丢弃部分体素,通过3D稀疏卷积编码器3D反卷积解码器预测原始体素占用(即对每个体素网格预测一个概率,越接近1则说明越可能有激光雷达点落在该处)。使用原始激光雷达点云体素占用作为监督,计算损失进行预训练。这样网络能学到高层次的语义特征表达。

本文距离感知的随机体素丢弃的实施方式是,将距离范围分为近距离、中距离和远距离3个部分,依次设置更低的丢弃概率。

  预训练后,将3D反卷积解码器丢弃,并替换为相应的下游任务解码器。

应用

  Occupancy-MAE可以用于3D目标检测、语义分割以及无监督域自适应任务。对于无监督域自适应任务,可以先同时使用源域和目标域的点云数据进行预训练(然后在源域上训练下游任务?)。

猜你喜欢

转载自blog.csdn.net/weixin_45657478/article/details/132197567
今日推荐