随着人工智能应用的大规模落地，数据标注市场在高速增长的同时，也面临着标注成本的挑战。据IDC报告显示：数据标注在AI应用开发过程中所耗费的时间占到了25%，部分医学类应用一条数据的标注成本甚至高达20元。数据精度的高要求、强人工的依赖、复杂的工具使用逻辑等都是造成标注成本高的核心痛点。

例如，计算机视觉领域的一个重要技术——图像语义分割，可以将图片切割成具有不同语义的色块，从而帮助机器理解整个视觉世界。在自动驾驶领域，车载摄像头采集的图像经过图像分割算法处理后，可以帮助汽车实现避障、寻找可行驶区域等功能。图像语义分割技术对训练数据要求较高，分割准确度通常需达到像素级别，在现实世界中不规则物体边缘的标注效率会更低。

▲ MatrixGo全景语义分割示意图

▲ 澳鹏MatrixGo平台工具箱

标注平台的智能化水平

Intelligence Level of Platform

我们将数据标注平台根据智能化及自动化水平，分为L0到L4的5个阶段。其中，L2（即智能交互）考虑到了“人”在数据标注环节中的交互作用。通过更好的算法介入和交互逻辑引导，使用户能够通过简易操作完成高效标注。

▲ L0到L4的5个智能化阶段

标注人员首先找到期望标注的对象，输入中心点后，模型给出首次识别的效果；对于识别不够精准的部分，标注人员只需通过点击响应的形式，来告知模型预测的不正确区域，即可得到更正后的识别结果，而无需依赖手动画线。

智能交互过程

Process of Intelligent Interaction

通过快速点选需要标注的前景对象，模型会预测出主体轮廓部分；当遇到标注有误需要修改的地方时，通过点选背景位置的反馈，工具会自动进行智能化收边和擦除操作。在模型识别过程中，标注人员通过简单的交互输入，得到更精准的识别效果。依靠简单点选取代稠密的轮廓绘制过程，根据项目实际应用统计，相对纯人工标注可节省约50%的标注时间。

▲ 交互流程示意

通过设计用户交互理解模块，输入用户的一系列交互行为，输出对应的高层特征，来建模用户输入的行为模式，可以有效推断出质量更好的标注结果。同时，辅助使用点击行为采样，根据用户的历史标注行为埋点，来提取有效的数据进行学习。输出上，考虑到不同项目和业务要求，支持一般的矩形框、多边形以及像素图等不同格式输出。

▲ 实现方法示意

在3D识别场景中，我们为快速识别点云中的目标也提供了交互式智能工具。模型能够在标注员圈定的范围内快速进行车道线识别，并将最终结果返回给标注员。

▲3D点云车道线识别

交互式智能标注通过结合算法识别+人工判断，可以极大程度上提升标注效率和准确率。通过AI赋能数据采标的全生命周期，提升数据生产的效率，充分给予AI应用开发以数据养料，从而为更多场景AI应用的大规模落地提供有力支持。

一种很新的交互式智能标注技术

标注平台的智能化水平

智能交互过程

猜你喜欢