Tutorial detallado sobre la instalación de CVAT y la anotación de imágenes [incluido el paso en el registro de boxes]

      cvat es una herramienta de anotación de imágenes, registra el proceso de instalación y uso:

Tabla de contenido

1. Instalación CVAT

paso 1 instalar ventana acoplable

paso2 Obtener permiso

paso3 Obtener permiso

step4 clonar el código fuente de cvat

step5 construye la imagen de la ventana acoplable

paso 6 ejecutar el contenedor de Docker Este paso necesita descargar la imagen pública de Docker, tomará tiempo dependiendo de la velocidad de la red, pero no será demasiado.

paso6 Crear un usuario administrador

step7 Cierra el servicio cvat

2. Tutorial de instalación y anotación de imágenes de CVAT

1. Registro

2. Etiquetado básico

2.1 Crear tarea

2.2 Página de lista de tareas

2.3 Página interior de la tarea

2.4 Anotar páginas

2.5 Consejos de etiquetado

3. Descarga el resultado de la anotación


 Recurre principalmente a los siguientes artículos:

[Herramientas comunes] instrucciones de instalación de cvat

Instrucciones de uso del CVAT

Un pequeño resumen del uso del CVAT

1. Instalación CVAT

paso 1 instalar ventana acoplable

        Cvat se ejecuta en docker, y docker debe instalarse primero.

sudo apt-get update
sudo apt-get --no-install-recommends install -y \
  apt-transport-https \
  ca-certificates \
  curl \
  gnupg-agent \
  software-properties-common
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository \
  "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
  $(lsb_release -cs) \
  stable"
sudo apt-get update
sudo apt-get --no-install-recommends install -y docker-ce docker-ce-cli containerd.io


paso2 Obtener permiso

        Para ejecutar docker sin permiso de root, debe obtener permiso.Después de obtener el permiso, debe reiniciar el sistema .

sudo groupadd docker
sudo usermod -aG docker $USER


paso3 Obtener permiso

        Instale docker-compose (1.19.0 o posterior). Compose es una herramienta para definir y ejecutar aplicaciones Docker de varios contenedores.

sudo apt-get --no-install-recommends install -y python3-pip python3-setuptools
sudo python3 -m pip install setuptools docker-compose

Pueden ocurrir errores en este paso:

aptsources.distro.NoDistroTemplateException: Error: no se pudo encontrar una plantilla de distribución para Kylin/kylin

Esto se debe a que la información del archivo del sistema /etc/lsb-release se modificó después de instalar el software Ubuntu Kylin. Ingrese el comando:

 sudo gedit /etc/lsb-release

El archivo encontrado se ve así:

Cambiar a: 

DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=18.04
DISTRIB_CODENAME=bionic
DISTRIB_DESCRIPTION="Ubuntu 18.04.5 LTS"

Vuelva a ejecutar el paso 3 para obtener permisos, no debería haber ningún problema.


step4 clonar el código fuente de cvat

        El repositorio oficial de github es muy lento, así que usé el espejo gitee.

sudo apt-get --no-install-recommends install -y git
git clone https://gitee.com/luohenyueji/cvat
cd cvat


step5 construye la imagen de la ventana acoplable

        Este es el paso más difícil y lento. Descargará muchas cosas, incluidas un montón de bibliotecas de Python, así que espere lentamente. Se recomienda utilizar un espejo para la instalación de la biblioteca de python. Específicamente, abra el directorio del código fuente cvat/Dockerfile descargado en el paso anterior y busque el elemento Requisitos de instalación. Luego modifique y agregue la imagen de python correspondiente. Yo uso la imagen de Alibaba Cloud, pero se puede reemplazar por otra.

#RUN DATUMARO_HEADLESS=1 python3 -m pip install --no-cache-dir -r /tmp/requirements/${DJANGO_CONFIGURATION}.txt
RUN DATUMARO_HEADLESS=1 python3 -m pip install -r /tmp/requirements/${DJANGO_CONFIGURATION}.txt -i https://mirrors.aliyun.com/pypi/simple/


        Luego ingrese el siguiente comando en el directorio cvat y espere lentamente. Si la instalación falla a la mitad, simplemente ingrese el comando nuevamente. Tenga en cuenta que se debe usar sudo.

sudo docker-compose build


paso 6 Ejecute el contenedor de Docker
Este paso consiste en descargar la imagen pública de Docker, lo que lleva tiempo dependiendo de la velocidad de la red, pero no demasiado.

docker-compose up -d


Después de este paso, puede abrir su sitio web cvat, pero necesita usar Google Chrome. Si ha instalado Google Chrome, no necesita preocuparse por eso, no existe un método de instalación para que ubuntu18.10 instale el navegador Chrome.

En este momento, Google Chrome abre localhost:8080 y puede ver la página cvat, como se muestra a continuación


Haga clic en crear una cuenta para crear un usuario común, pero es mejor crear una cuenta de administrador por primera vez, vea el siguiente paso para obtener más detalles.

paso6 Crear un usuario administrador

Ingrese el siguiente comando y luego se le pedirá que cree una contraseña de cuenta de administrador.

docker exec -it cvat bash -ic 'python3 ~/manage.py createsuperuser'


step7 Cierra el servicio cvat

Después de ejecutar el paso 6, incluso si se reinicia el servidor, el servicio cvat seguirá ejecutándose. Para cerrar ingrese el siguiente comando en el directorio cvat:

docker exec -it cvat bash -ic 'python3 ~/manage.py createsuperuser'


Para reiniciar, repita el paso 6.

2. Tutorial de instalación y anotación de imágenes de CVAT

1. Registro

  • Es necesario registrarse cuando se utiliza CVAT por primera vez,
  • Una vez registrado, el usuario puede crear una tarea de etiquetado.

2. Etiquetado básico

2.1 Crear tarea

  • Después de iniciar sesión, verá la siguiente interfaz: La unidad más pequeña de etiquetado CVAT es Tarea, y cada Tarea es una tarea de etiquetado. Haga clic en el botón Tarea para ver las tareas creadas y haga clic para crear una nueva tarea.
  • La página para crear una nueva tarea es la siguiente, siga los pasos identificados a continuación, el primer paso es completar el nombre de la tarea, el nombre del proyecto a asociar (opcional), el segundo paso es establecer la etiqueta, el el tercer paso es seleccionar la fuente de datos de la etiqueta, y el cuarto paso es seleccionar los parámetros de configuración avanzada, el quinto paso es enviar.
  • Etiqueta etiqueta explicación detallada
    • Hay dos modos para agregar etiquetas: Raw y Constructor.Constructor puede agregar y ajustar la configuración de etiquetas una por una, y establecer el nuevo nombre de etiqueta, color, atributos, etc. Si desea utilizar la función de filtrado, puede agregar la etiqueta "seleccionada" aquí y luego puede filtrar los datos etiquetados en función de esta etiqueta.
    • Raw es un archivo en formato json que se puede copiar con un solo clic. Esta función puede establecer fácilmente varias etiquetas cuando las etiquetas correspondientes de varias tareas son las mismas. El contenido del ejemplo Raw se muestra en la siguiente figura. El contenido json se puede copiar a través del botón Copiar para la nueva configuración de etiqueta de tarea. Después de pegar, haga clic en Listo para guardar la configuración actual y en Restablecer para mantener la configuración original. Para Por ejemplo, si se cambia el color de una etiqueta en la nueva tarea, después del cambio, si se determina que la nueva configuración es inapropiada, Restablecer puede restaurar la configuración original con un solo clic.
  • Configuración avanzada Muchos parámetros de la configuración avanzada no se utilizan en esta etapa. Los siguientes son solo algunos parámetros de uso común:

    • Use fragmentos zip: para datos de video, comprimidos en formato zip
    • Usar caché: caché de datos
    • Calidad de imagen: se utiliza para especificar la calidad de la imagen cargada. Cuando la imagen de alta resolución se carga demasiado lentamente, la resolución se puede reducir para aumentar la velocidad. Sin embargo, si elige leer los datos del servidor en el anterior Paso, la velocidad de lectura de la imagen mejorará considerablemente.
    • Tamaño de superposición: cuando los datos actuales se dividen en N trabajos para etiquetar, el número de cuadros se repite entre cada trabajo;
    • Tamaño del segmento: divide los datos actuales en N trabajos. N es el valor aquí. Se usa principalmente para escenas en las que hay demasiadas imágenes y varias personas necesitan marcarlas juntas. Cada persona marca un trabajo y usa este parámetro para dividir el datos en bloques;
    • Cuadro de inicio: es posible que no sea necesario marcar completamente los datos de video recopilados. Por ejemplo, el cuadro de destino puede ser solo el cuadro 20-100. Este parámetro se usa para configurar el cuadro de inicio;
    • Cuadro de parada: correspondiente al cuadro de inicio, esta es la posición del cuadro final;
    • Paso de cuadro: puede que no sea necesario marcar cada cuadro, por ejemplo, marque cada cuadro M, y M es el valor aquí;
    • No se necesitan otros parámetros por ahora, consulte la documentación oficial para obtener más detalles.

2.2 Página de lista de tareas

  • La tarea creada se ve así
    • Expandir en Acciones:
      • Subir anotaciones: Admite la importación de etiquetas. Por ejemplo, en base a las etiquetas de cabeza y cuerpo humano existentes en el conjunto de datos públicos de Crowdhuman, si desea continuar etiquetando los vehículos en este conjunto de datos para el conjunto de entrenamiento de tres tipos de objetivos : cabezas, peatones y automóviles, puede usar esto La función importa las etiquetas de cabeza y cuerpo, y solo usa CVAT para marcar las etiquetas de vehículos. Para operaciones específicas, consulte el Capítulo 5 "Importación de etiquetas" de este tutorial.
      • Exportar conjunto de datos de tareas: descargue las etiquetas del conjunto de datos al local.
      • Anotación automática: etiquetado semiautomático, CVAT admite la generación en línea de etiquetas para conjuntos de datos con modelos previamente entrenados, lo que puede mejorar en gran medida la eficiencia del etiquetado; consulte el Capítulo 6 "Etiquetado semiautomático" para obtener más información.
      • Exportar tarea: Admite la importación o exportación de una tarea existente, consulte aquí para obtener más detalles .
      • Mover a proyecto: como su nombre lo indica, cuando esta tarea se mueve a otro proyecto, el atributo de la etiqueta cambia y los problemas de discrepancia de etiquetas que ocurren durante el movimiento deben modificarse en consecuencia.
      • Eliminar: Eliminar esta tarea.

2.3 Página interior de la tarea

  • La página interna de la tarea se muestra en la figura a continuación. En la página interna de la tarea, se puede modificar cierta información básica de la tarea y también se pueden asignar tareas. descrito de la siguiente manera:
      1. Nombre de la tarea, se puede modificar
      2. Esta Acciones es la misma que la descripción de Acciones en la Sección 2.2
      3. Rastreador de problemas, generalmente no se usa, se ignora temporalmente
      4. Configuración de etiquetas, modificable
      5. Asignar esta tarea a un miembro
      6. Asignar este trabajo a un miembro para etiquetarlo
      7. Determinar el inspector de calidad, que inspeccionará la calidad de los datos marcados

2.4 Anotar páginas

  • Haga clic en el trabajo correspondiente para ingresar a la interfaz de anotación. La interfaz se divide en 5 partes, como se muestra en la siguiente figura:
    • Encabezado: incluye principalmente la navegación de varias funciones básicas de CVAT, así como la configuración relacionada del usuario actual. Las funciones básicas incluyen Proyecto\Tareas\Almacenamiento en la nube\Modelos, que representan respectivamente proyectos de etiquetado, tareas de etiquetado, almacenamiento en la nube y pre- modelos entrenados.
    • Panel superior: incluye principalmente navegación de imágenes (seleccionar imagen), menú, guardar, deshacer/restaurar, pantalla completa, estadísticas de resultados de anotaciones, cambio de modo.
    • Área de trabajo: Área de trabajo, el área donde se encuentra la imagen.
    • Barra lateral de controles: controle la barra lateral de los comandos relacionados, incluida la configuración del tamaño y la posición de las imágenes, la creación de formas, la edición de pistas y otras funciones básicas de anotación.
    • Barra lateral de objetos: barra lateral relacionada con etiquetas, que incluye dos opciones (objetos y etiquetas), así como configuraciones relacionadas con la apariencia (es decir, el color de visualización, la transparencia, etc. de varias etiquetas).

  • Relacionado con la navegación
    • CVAT proporciona funciones tales como seleccionar el cuadro anterior, el cuadro siguiente, saltar al cuadro siguiente (anterior) en unidades de pasos, reproducir cada cuadro secuencialmente, saltar al cuadro inicial y final.
    • Después de seleccionar el marco, hay varias operaciones básicas para seleccionar la posición y el zoom de la imagen:
      • Mover imagen/Elegir posición central: utilice las opciones de la primera imagen.
      • Las otras dos funciones son: ajustar la imagen al tamaño de la pantalla/seleccionar un área para ampliar.

2.5 Consejos de etiquetado

  • Las teclas de acceso directo en el proceso de etiquetado pueden ahorrar mucho esfuerzo. Las siguientes son algunas de las más utilizadas. Para obtener más información, consulte la documentación oficial aquí :
    • Guardar: Ctrl + S
    • Eliminar: Eliminar
    • Zoom: Desplazamiento del mouse, acercar, alejar
    • Arrastrar: haga clic y arrastre la imagen con el botón izquierdo del mouse para ajustar la posición
    • cuadro siguiente: F
    • Último cuadro: D
    • Retroceder diez hojas: Mayús+Ctrl+V
    • Saltar hacia adelante diez hojas: Shift+Ctrl+C
    • Copiar cuadro: Ctrl + C
    • Cuadro de pegado: Ctrl + V
    • Repita el último parámetro del marco de etiquetado: N, como marcar una clase de cuadros de encabezado continuamente, luego presione N cada vez que repita el etiquetado para marcar directamente un cuadro de encabezado
    • Etiquetar continuamente el objeto seleccionado en todos los fotogramas posteriores: Ctrl + B
    • Convertir etiqueta: Ctrl+(0..9)

3. Descarga el resultado de la anotación

Supongo que te gusta

Origin blog.csdn.net/ZHUO__zhuo/article/details/125068660
Recomendado
Clasificación