【数据相关】如何进行数据标注(2)

现在网络上关于深度学习算法的文章很多,但深度学习其实是数据驱动型。很多时候数据足够好,能给算法开发提供很大的便利。

因此,本文主要讲解数据标注。文章共两个部分:(1)数据标注综述(2)数据标注实践要点

本文是第二部分:数据标注实践要点。本文可能会帮助读者更直观的认识对图片标注中的问题。

1、要点来源

本文的标注要点来源于图像标注专家Adela Barriuso的标注笔记。她于2007年开始使用labelme系统地标注SUN数据库,标注了 超过25万个物体。笔记记录了标注过程中曾遇到的困难和采用的解决方案,以便得到一致性高的注释。

Adela Barriuso在西班牙的一家服装店里进行数据标注,这就是传说中的大隐隐于市吗?哈哈。

2、标注笔记

下面转述Adela Barriuso在数据标注中的心得。

我工作在一个服装店内。服装店从早上10点开到下午8点,仅在下午两点有个短暂的休息。

尽管工作时间很长,但有很多空闲时间。因为我是服装店的老板,所以可以在这段时间内做任何我想做的事。虽然我时刻准备好服务客户,但是在漫长的一天内,大多数时间是啥也不干的。在过去我经常读书,读的还很快,慢慢的我就失去了看书的乐趣。出于这个原因,我开始与LabelMe合作,去做一些有科学价值的事。

2.1 开始标注一张图片

在开始一张图片时,首先应该对图像有个整体的评估,衡量它的难度。如果该图片是一个开放空间,那么通常先标注大的物体,比如先开始标注天空,然后再继续添加其他东西。对于密闭空间,首先要标记天花板等。标记的顺序不重要,但是必须采用相对更容易的标注方式。在标注完天花板之后,就开始标注墙壁,然后是房间里的所有其他物体,最后是地板。在标注时,应该在一行中标注所有想通过类型的对象,以避免标注写错。

我从不会标注镜子里反射的物体。但是有趣的是,反射如何帮助检测一些无法清晰识别的对象。 在识别对象时,使用某种推理似乎具有重要作用。

   

Reference

Barriuso A, Torralba A. Notes on image annotation[J]. arXiv preprint arXiv:1210.3448, 2012.

猜你喜欢

转载自www.cnblogs.com/lky-learning/p/12581303.html