TorontoCity：众生观天下

每天一分钟，带你读遍机器人顶级会议文章
标题：TorontoCity: Seeing the World with a Million Eyes
作者：Shenlong Wang, Min Bai, Gellert Mattyus, Hang Chu , Wenjie Luo, Bin Yang, Justin Liang Joel Cheverie, Sanja Fidler， Raquel Urtasun
来源：ICCV 2017 ( IEEE International Conference on Computer Vision)
编译：博主
欢迎个人转发朋友圈；其他机构或自媒体如需转载，后台留言申请授权

摘要

千面只知其一二，实乃井底之蛙。

                            ---- George Eliot

本文将介绍TorontoCity数据集，覆盖了整个大多伦多地区（the greater Toronoto Area），共有8439公里的道路里程和大约40万座建筑，总占地面积高达712.5平方公里！本数据集的独特之处在于其包含了各种类型的数据，例如飞机、无人机和汽车等等，从不同的角度观察整个城市。

由于数据量巨大，人工标注简直是天方夜谭；因此本文使用不同类型的高精度地图来生成ground truth，并为此开发了一些工具来对这些地图进行对齐以尽可能减少工作量。

针对此数据集，本文已经设计了一系列有趣的任务，包括建筑高度估计、道路中心线边缘线提取、建筑实例分割、建筑交点提取、语义标注和场景分类等等。本文的实验表明这些任务对于CNN来说仍旧是非常具有挑战性的工作，希望大家积极挑战！

最后论文也提供了数据集的链接（暂时无法访问）：

http://www.cs.toronto.edu/˜torontocity/

在这里插入图片描述
图1、TorontoCity数据集中所包含的各种数据，包括飞机/无人机俯视拍摄的影响、地面采集的全景影像和车载/机载激光点云数据。

在这里插入图片描述
图2、本文使用的高精度地图，有道路建筑图、三维城市图和产权元数据。

在这里插入图片描述
图3、与本文数据集相关联的任务的示意图。

在这里插入图片描述

TorontoCity：众生观天下

摘要

猜你喜欢