一、数据集概况

1.1 主要信息

本篇论文也是在数据集上的贡献，虽没有方法上的改进，但是作者贡献给大家一个新数据集。

数据集名称：The Oxford RobotCar Dataset
应用领域：自动驾驶
采集时间：2014年5月至2015年12月
采集地点：牛津中部的路线（频繁穿越）
数量：近2000万张图像
文件大小：未压缩总大小为23.15TB
目的：为了能够研究在真实世界的动态城市环境中，如何解决自动驾驶车辆的长期定位和绘图。
附加：在所有天气条件下收集数据（大雨、夜间、阳光直射和降雪）
完整数据集下载地址： http://robotcar-dataset.robots.ox.ac.uk

1.2 所收集的数据的3D可视化示例

图1展示的是从数据集中不同区域构建的3D地图样本：
图1 从数据集中不同区域构建的3D地图样本

二、RobotCar platform

1.RobotCar展示

图二展示了收集数据的机器人车的概况，以及传感器的位置。
x向前（红色）、y向右（绿色）、z向下（蓝色）
图2 机器人车

2.2 传感器配备情况

车辆上传感器的位置如图2所示，具体为：

1 x Point Grey Bumblebee XB3
3 x Point Grey Grasshopper2
2 x SICK LMS-151 2D LIDAR
1 x SICK LD-MRS 3D LIDAR
1 x NovAtel SPAN-CPT ALIGN inertial and GPS
navigation system

三、数据收集

3.1 收集方式

在整个数据收集期间，车辆是手动驾驶的，没有使用自主功能。
主要数据收集路线如图3所示，在一年中被遍历了100多次（在路线的某些路段，在数据收集期间发生了重大的结构变化）
下面图4中表格部分列出了全年数据集的汇总统计数据,以及不同条件标签的遍历次数。

3.2 数据格式

作者将数据集分为单独的路径，每个路径对应一次单程traversal，为了减少下载文件的大小，又进一步将每个traversal划分为块，其中每个块对应于大约6分钟的路经的片段，在一次traversal中，来自不同传感器的块将在时间上重叠；但是，块在不同遍历之间不对应。每个区块都被打包为tar归档文件，以便下载；归档文件中的文件夹结构如下图图5所示。
图5为单个数据集的目录布局如下图所示。当从多个遍历中下载多个tar归档文件时，将它们全部解压缩到同一目录中将保留文件夹结构。以ldmrs_开头的文件夹下是3D激光雷达扫描；lms_front或lms_rear为2D激光雷达扫描；momo_开头的是环视摄像头拍摄的；stereo_开头的文件夹下是正常的摄像头拍摄的；gps.csv以及ins.csv是SPAN-CPT的GPS和惯性传感器数据（详细内容见下段数据类型的格式介绍）
图5.单个数据集的目录布局
为了便于移植，作者将内部日志格式的传感器数据转换为标准数据格式。每种数据类型的格式如下：

图像：所有图像都存储为无损压缩PNG文件^ 2，采用未经校正的8位原始 Bayer格式，文件的结构为（camera）/（sensor）/（timestamp）.png
2D激光雷达扫描：每次扫描的2D激光雷达返回值以双精度浮点值的形式存储在二进制文件中，类似于[6]中的Velodyne扫描格式.文件的结构为（laser）/（timestamp）.bin，其中（laser）是lms_front或lms_rear
3D激光雷达扫描：LD-MRS返回的3D激光雷达以与2D激光雷达扫描相同的压缩双精度浮点二进制格式存储。文件的结构为ldmrs/（timestamp）.bin
GPS+Inertial:来自SPAN-CPT的GPS和惯性传感器数据以ASCII格式的csv文件提供。提供了两个单独的文件：gps.csv以及ins.csv文件.
视觉里程计（VO）：GPS+惯性解中的局部误差可能导致使用该传感器作为姿态源构建的局部地图不连续（由于卫星信号丢失或重新获取）。对于一些应用，优选不一定全局精确的平滑局部位姿source，例如图5所示的局部3D点云构造。

总结

作者在这篇文章中向我们奉献了一个新的大规模数据集，主要致力于自动驾驶领域的相关研究，以及作者在对这个数据集制作的过程中总结的经验教训：一是仅记录原始数据，二是使用向前兼容格式，三是分开记录和处理的数据。这三点经验教训值得今后进行数据集制作的研究人员参考学习。

1 Year, 1000km: The Oxford RobotCar Dataset 论文笔记

文章目录