Una tecnología de anotación inteligente interactiva muy nueva

Con la implementación a gran escala de aplicaciones de inteligencia artificial, mientras que el mercado de etiquetado de datos está creciendo rápidamente, también enfrenta el desafío de los costos de etiquetado. Según el informe de IDC, el etiquetado de datos representa el 25% del tiempo dedicado al proceso de desarrollo de aplicaciones de IA, y el costo de etiquetar una pieza de datos en algunas aplicaciones médicas es incluso de 20 yuanes . Los requisitos de alta precisión de datos, la fuerte dependencia manual y la lógica de uso de herramientas complejas son todos los puntos principales que causan altos costos de etiquetado.

Por ejemplo, una tecnología importante en el campo de la visión por computadora: la segmentación semántica de imágenes puede cortar imágenes en bloques de color con diferentes semánticas, lo que ayuda a las máquinas a comprender todo el mundo visual. En el campo de la conducción autónoma, una vez que el algoritmo de segmentación de imágenes procesa las imágenes recopiladas por la cámara a bordo, puede ayudar al automóvil a realizar funciones como evitar obstáculos y encontrar áreas manejables. La tecnología de segmentación semántica de imágenes tiene altos requisitos para los datos de entrenamiento, y la precisión de la segmentación generalmente debe alcanzar el nivel de píxel. En el mundo real, la eficiencia de etiquetado de los bordes irregulares de los objetos será menor.

▲ Diagrama esquemático de la segmentación semántica panorámica de MatrixGo

▲ Caja de herramientas de la plataforma Appen MatrixGo

El nivel de inteligencia de la plataforma de etiquetado

Nivel de inteligencia de la plataforma

Dividimos la plataforma de etiquetado de datos en cinco etapas de L0 a L4 según el nivel de inteligencia y automatización. Entre ellos, L2 (es decir, interacción inteligente) tiene en cuenta la interacción de "personas" en el proceso de etiquetado de datos. A través de una mejor intervención del algoritmo y una guía lógica interactiva, los usuarios pueden completar una anotación eficiente a través de operaciones simples.

▲ Cinco etapas inteligentes de L0 a L4

El anotador primero encuentra el objeto que se va a anotar y, después de ingresar el punto central, el modelo da el efecto del primer reconocimiento; para las partes que no se reconocen con precisión, el anotador solo necesita hacer clic en el formulario de respuesta para informar al modelo de el área incorrecta predicha Obtenga resultados de reconocimiento corregidos sin depender del dibujo lineal manual.

 

Proceso interactivo inteligente

Proceso de Interacción Inteligente

Al hacer clic rápidamente en el objeto de primer plano que debe marcarse, el modelo predecirá el contorno del cuerpo principal; cuando haya una marca incorrecta que deba modificarse, al hacer clic en la retroalimentación de la posición de fondo, la herramienta automáticamente realizar operaciones inteligentes de cierre y borrado de bordes. Durante el proceso de reconocimiento del modelo, los anotadores pueden obtener resultados de reconocimiento más precisos a través de una simple entrada interactiva. Basándose en la selección de puntos simples para reemplazar el denso proceso de dibujo del contorno, de acuerdo con las estadísticas de aplicación reales del proyecto, puede ahorrar alrededor del 50% del tiempo de etiquetado en comparación con el etiquetado manual puro.

▲ Diagrama de flujo de interacción

Al diseñar un módulo de comprensión de la interacción del usuario , ingresar una serie de comportamientos de interacción del usuario y generar características de alto nivel correspondientes para modelar los patrones de comportamiento de entrada del usuario, es posible inferir efectivamente resultados de anotación de mejor calidad. Al mismo tiempo, ayuda en el uso del muestreo de comportamiento de clics y entierra puntos de acuerdo con el comportamiento de marcado histórico del usuario para extraer datos efectivos para el aprendizaje. En términos de salida, teniendo en cuenta los diferentes requisitos comerciales y de proyectos, admite la salida en diferentes formatos, como cuadros rectangulares generales, polígonos y mapas de píxeles.

▲ Ilustración del método de implementación

En escenarios de reconocimiento 3D, también proporcionamos herramientas inteligentes interactivas para identificar rápidamente objetos en nubes de puntos. El modelo puede identificar rápidamente líneas de carril dentro del rango delineado por el anotador y devolver el resultado final al anotador.

▲Reconocimiento de línea de carril de nube de puntos 3D

El etiquetado inteligente interactivo puede mejorar en gran medida la eficiencia y la precisión del etiquetado al combinar el reconocimiento de algoritmos + el juicio manual. A través del ciclo de vida completo de la IA que potencia la adquisición y estandarización de datos, se mejora la eficiencia de la producción de datos y el desarrollo de aplicaciones de IA se alimenta completamente con datos, lo que brinda un sólido soporte para la implementación a gran escala de aplicaciones de IA en más escenarios.

Supongo que te gusta

Origin blog.csdn.net/Appen_China/article/details/131311562
Recomendado
Clasificación