如何为计算机视觉任务标记图像

标记每个图像中每个感兴趣的对象
构建计算机视觉模型是为了了解哪些像素模式对应于感兴趣的对象。因此，如果我们训练一个模型来识别一个对象，我们需要在图像中标记该对象的每个外观。如果我们不在某些图像中标记对象，我们将向模型引入假阴性。例如，在棋子数据集中，我们需要标记棋盘上每个棋子的外观——我们不会只标记一些白色棋子。
标记整个对象
我们的边界框应该包含整个感兴趣的对象。仅标记对象的一部分会使我们的模型与完整对象的构成混淆。例如，在我们的国际象棋数据集中，请注意每个棋子是如何完全封闭在边界框中的。
标记遮挡对象
遮挡是指由于照片中的物体阻挡了物体而部分超出图像中的视野。最好标记甚至被遮挡的物体。此外，通常的最佳做法是将被遮挡的对象标记为完全可见，而不是仅为对象的部分可见部分绘制边界框。例如，在国际象棋数据集中，一个棋子会经常遮挡另一个棋子的视图。即使框重叠，也应标记这两个对象。（一个常见的误解是盒子不能重叠。
创建紧密边界框
边界框应紧紧围绕感兴趣的对象。（但是，你永远不应该有一个太紧的盒子，以至于它切断了物体的一部分。紧密边界框对于帮助我们的模型精确地了解哪些像素构成感兴趣的对象与图像的不相关部分至关重要。
创建特定的标签名称
在确定给定对象的标签名称时，最好在更具体而不是更少方面出错。将标注分类重新映射为更通用总是更容易，而更具体则需要重新标注。
例如，假设您正在构建一个狗探测器。虽然每个感兴趣的对象都是一只狗，但为和创建一个类可能是明智的。在最初的模型构建中，我们的标签可以组合成 .但是，如果我们一开始并后来意识到拥有单个品种很重要，我们将不得不完全重新标记我们的数据集。labradorpoodledogdog
例如，在我们的国际象棋数据集中，我们有和.我们总是可以将它们组合成，甚至将所有类组合为 be。white-pawnblack-pawnpawnpiece
保持清晰的标签说明
不可避免地，我们需要向数据集添加更多数据——这是模型改进的关键要素。像主动学习这样的策略确保我们花时间明智地贴标签。因此，拥有清晰、可共享和可重复的标记说明对于我们未来的自我和同事创建和维护高质量的数据集至关重要。
我们在这里讨论的许多技术都应该包括在内：标记整个对象，使标签紧，标记所有对象等。在更具体的情况下犯错总是比更少更好。
使用这些标记工具
现在我们知道了如何有效地标记，我们应该如何标记我们的数据？如果我们给自己贴标签，我们可以使用Roboflow Annotate等工具来添加和维护标签。

资料来源于网络，仅供交流学习

如何为计算机视觉任务标记图像

猜你喜欢