【论文笔记】Occupancy-MAE: Self-supervised Pre-training Large-scale LiDAR Point Clouds with Masked Occupan

论文名称：Occupancy-MAE: Self-supervised Pre-training Large-scale LiDAR Point Clouds with Masked Occupancy Autoencoders
原文链接：https://arxiv.org/abs/2206.09900

这篇文章针对激光雷达感知任务标注困难且耗时的特点，提出一种针对激光雷达点云感知的自监督预训练方法Occupancy-MAE。该方法使用掩蔽占用自编码器（ Masked Occupancy Autoencoders，MAE），可在大型无标签数据集上进行训练。

方法

在这里插入图片描述
将激光雷达点云体素化后，使用距离感知的随机体素丢弃（由于距离越远点云越稀疏，丢弃概率需要设置得越小）丢弃部分体素，通过3D稀疏卷积编码器和3D反卷积解码器预测原始体素占用（即对每个体素网格预测一个概率，越接近1则说明越可能有激光雷达点落在该处）。使用原始激光雷达点云体素占用作为监督，计算损失进行预训练。这样网络能学到高层次的语义特征表达。

本文距离感知的随机体素丢弃的实施方式是，将距离范围分为近距离、中距离和远距离3个部分，依次设置更低的丢弃概率。

预训练后，将3D反卷积解码器丢弃，并替换为相应的下游任务解码器。

应用

Occupancy-MAE可以用于3D目标检测、语义分割以及无监督域自适应任务。对于无监督域自适应任务，可以先同时使用源域和目标域的点云数据进行预训练（然后在源域上训练下游任务？）。

【论文笔记】Occupancy-MAE: Self-supervised Pre-training Large-scale LiDAR Point Clouds with Masked Occupan

方法

应用

猜你喜欢