TorontoCity:众生观天下

每天一分钟,带你读遍机器人顶级会议文章
标题:TorontoCity: Seeing the World with a Million Eyes
作者:Shenlong Wang, Min Bai, Gellert Mattyus, Hang Chu , Wenjie Luo, Bin Yang, Justin Liang Joel Cheverie, Sanja Fidler, Raquel Urtasun
来源:ICCV 2017 ( IEEE International Conference on Computer Vision)
编译:博主
欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权


摘要

千面只知其一二,实乃井底之蛙。

                            ---- George Eliot

本文将介绍TorontoCity数据集,覆盖了整个大多伦多地区(the greater Toronoto Area),共有8439公里的道路里程和大约40万座建筑,总占地面积高达712.5平方公里!本数据集的独特之处在于其包含了各种类型的数据,例如飞机、无人机和汽车等等,从不同的角度观察整个城市。

由于数据量巨大,人工标注简直是天方夜谭;因此本文使用不同类型的高精度地图来生成ground truth,并为此开发了一些工具来对这些地图进行对齐以尽可能减少工作量。

针对此数据集,本文已经设计了一系列有趣的任务,包括建筑高度估计、道路中心线边缘线提取、建筑实例分割、建筑交点提取、语义标注和场景分类等等。本文的实验表明这些任务对于CNN来说仍旧是非常具有挑战性的工作,希望大家积极挑战!

最后论文也提供了数据集的链接(暂时无法访问):

http://www.cs.toronto.edu/˜torontocity/

在这里插入图片描述
图1、TorontoCity数据集中所包含的各种数据,包括飞机/无人机俯视拍摄的影响、地面采集的全景影像和车载/机载激光点云数据。

在这里插入图片描述
图2、本文使用的高精度地图,有道路建筑图、三维城市图和产权元数据。

在这里插入图片描述
图3、与本文数据集相关联的任务的示意图。


在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/u012348774/article/details/82902347