01Aprendizaje profundo-Detección de objetivos-Introducción

La detección de objetos es una tarea importante en el campo de la visión por computadora, cuyo objetivo es detectar y localizar con precisión objetos objetivo específicos a partir de imágenes o videos.

1. Definición del problema de detección de objetivos.

La detección de objetos es el proceso de encontrar y clasificar un número variable de objetos en una imagen .

2. Problemas comunes en el proceso de detección de objetivos.

Problemas con el tipo y la cantidad de objetivos
problema de escala objetivo
Problemas de interferencia ambiental externa.

3. La diferencia entre detección de objetivos y clasificación de imágenes.

Detección de objetivos:

La detección de objetivos no solo proporciona un marco rectangular (es decir, la ubicación del objeto de detección de objetivos) , sino que también clasifica los objetos en el marco rectangular . Los diferentes colores de los marcos rectangulares representan diferentes categorías y proporcionan que el objeto de detección pertenece a la categoría de objetivo. .nivel de confianza .

Clasificación de imágenes:

La clasificación de imágenes utiliza principalmente imágenes como entrada y distribuciones de probabilidad de imágenes que pertenecen a diferentes categorías como salida. Determina principalmente la categoría de las imágenes. La clasificación de imágenes es solo una parte de la detección de objetivos.

Resumir:

Ya sea clasificación de imágenes o detección de objetivos , cuando se utiliza tecnología de aprendizaje profundo para el procesamiento, se requiere un paso de extracción de características . Para los métodos clásicos de aprendizaje automático , la extracción de características generalmente se completa mediante el diseño de características manuales , mientras que el aprendizaje profundo a menudo usa redes neuronales convolucionales . Se utiliza para extraer características.

4. Detección de objetivos versus segmentación de objetivos

Detección de objetivos:

Principalmente para localizar la posición del objetivo, la información de posición generalmente se representa como un rectángulo, y el rectángulo se puede representar mediante datos de cuatro dimensiones.

Segmentación objetivo:

Cada píxel debe dividirse en diferentes categorías , y el resultado de la segmentación debe ser consistente con el tamaño de la imagen original. El resultado de salida del mismo tamaño que la imagen original a menudo se obtiene mediante muestreo ascendente o deconvolución.

Clasificación de imágenes: Simplemente especifique la categoría a la que pertenece el objetivo correspondiente
Detección de objetivos: necesidad de localizar el objetivo y clasificarlo.
Segmentación de objetivos: debe encontrar el área ocupada por el objetivo actual. La figura c de arriba es segmentación semántica y d es segmentación de instancias.
Segmentación semántica: solo es necesario encontrar el área ocupada por el mismo tipo de objetos
Segmentación de instancias: no solo se deben distinguir objetivos en diferentes niveles semánticos, sino que también es necesario dividir objetivos de la misma categoría en diferentes instancias.

En el proceso de desarrollo de algoritmos de detección de objetivos, los algoritmos tradicionales basados en funciones manuales alguna vez fueron la corriente principal. Estos algoritmos tradicionales identifican los objetos de destino mediante el diseño y la extracción de características diseñadas manualmente, incluidas características de Haar, características de HOG, características de SIFT, etc.

Este artículo explorará en profundidad el algoritmo tradicional basado en funciones manuales en el algoritmo de detección de objetivos e introducirá sus principios, ventajas y desventajas , y su aplicación en visión por computadora.

1. Definición del algoritmo de detección de objetivos tradicional basado en funciones manuales El
algoritmo de detección de objetivos tradicional basado en funciones manuales es un tipo temprano de algoritmo de detección de objetivos que identifica objetos objetivo diseñando y extrayendo funciones manualmente. Estas características suelen basarse en información local de la imagen, como bordes, textura, color, etc. Sobre la base de la extracción de características, los algoritmos tradicionales suelen utilizar clasificadores o detectores para determinar si hay un objeto objetivo en la imagen y proporcionar la ubicación y el tamaño del objetivo.