Clasificación objetivo : dar una imagen, clasificación
Detección de objetivos : muestra una imagen, encuentra el objetivo y dibuja con un marco rectangular
La clasificación es el conjunto de una imagen , y la detección es un paso más para encontrar una parte de una imagen. Las pruebas generales se basan en la clasificación,
Por ejemplo, use la ventana deslizante para buscar, y luego use el clasificador para clasificar si es un objetivo o un fondo, o una clasificación múltiple (esta es la diferencia entre regresión y clasificación).
Proyecto de investigación previa Selección de algoritmo Conjunto de datos de descarga y entorno de empaquetado Modelo de construcción Modelo de capacitación Optimización del modelo de prueba
La diferencia entre la detección de objetivos de aprendizaje automático tradicional y la detección de objetivos de aprendizaje profundo: la detección de objetivos de aprendizaje automático tradicional presta más atención a la extracción de características, las características son generalmente más interpretables, el aprendizaje profundo es una red de convolución de múltiples capas, características de autoaprendizaje (características de convolución ) No es necesario diseñar las funciones usted mismo, las funciones solo las entiende la computadora.
Uno. Detección de objetivos tradicional ( no el aprendizaje automático más tradicional ):
Cuadro de candidato: generalmente use el método de ventana deslizante para extraer
Extracción de características (reconocimiento de patrones):
Características, texturas, colores, formas, etc. diseñados a mano de bajo nivel (sift surf haar LBP HOG)
Funciones de nivel medio aprendidas por la máquina, como funciones de pca, lda
Clasificador: un clasificador entrenado por adelantado (basado en las características anteriores), aquí están las dos clasificaciones, es decir, el objetivo y el fondo, también hay clasificación múltiple
Algoritmo NMS: supresión no máxima, eliminar cuadros innecesarios. Mejora Soft-NMS
Métodos tradicionales de detección de objetivos:
haar presenta el algoritmo Adaboost (clasificador)
HOG + SVM (generalmente utilizado para la detección de peatones)
Función HOG SVM (clasificador)
Calcule el mapa de características DPM, calcule el mapa de respuesta, el entrenamiento del clasificador SVM latente, la detección y el reconocimiento
Detección de dos objetivos de aprendizaje profundo
La detección de objetivos de aprendizaje profundo generalmente se divide en dos tipos, dos etapas y una etapa
Usando características convolucionales de CNN, el algoritmo RPN recomienda cuadros candidatos
Componentes principales : red CNN (red troncal), red RPN (recomendación regional, mecanismo de anclaje)
Desde un punto de vista estratégico, en dos etapas, como la detección de objetivos de aprendizaje automático tradicional, requiere un cuadro de candidato y luego llega a juzgar. Es solo que ahora el uso de redes neuronales convolucionales de múltiples capas proviene de características de aprendizaje, lo tradicional es diseñar características usted mismo
Una etapa(Yolo , SSD , Retina-Net)
Use las características de convolución CNN, sin usar RPN, para devolver directamente la probabilidad de clase y coordinar los valores de los objetos
Componentes principales : red CNN (red troncal), red de regresión
La precisión de una etapa es baja, pero el bloqueo de velocidad, el efecto de detección de objetos pequeños no es bueno, la detección de fallas altas
Dos etapas tiene una alta precisión y utiliza el mecanismo de anclaje, pero la velocidad es lenta, el tiempo de entrenamiento es largo y la falsa alarma es alta