Clasificación de enfermedades de la piel basada en métodos detallados débilmente supervisados
Título del artículo
Clasificación de lesiones cutáneas mediante un método detallado débilmente supervisado
Fuente del artículo
2020 25a Conferencia Internacional sobre Reconocimiento de Patrones (ICPR)
motivación del autor
Existen muchos trabajos sobre clasificación de enfermedades de la piel basados en redes neuronales convolucionales (CNN), pero pocos involucran la similitud entre diferentes lesiones. Por ejemplo, el melanoma (maligno) y los lunares (benignos) son muy similares en apariencia, pero es difícil. para que las redes neuronales distingan.
ideas del autor
La atención espacial y la atención del canal se utilizan para enriquecer los mapas de características y guiar a la red para que se centre en regiones destacadas de una manera débilmente supervisada . También se utilizan métodos de preprocesamiento, como la eliminación de componentes y el aumento de datos, para mejorar la precisión.
Red de arquitectura
Para una imagen de entrada, primero se eliminan los componentes para evitar afectar la extracción de características posterior y, en segundo lugar, la red determina si la imagen necesita mejorarse en función de la etiqueta de la imagen. Los autores aumentaron los datos sólo sobre el melanoma y la queratosis seborreica porque hay muchos más datos sobre los lunares que los otros dos. Luego, la red se divide en dos ramas. La rama superior usa CNN para extraer características globales de la imagen completa, la rama inferior es el módulo DRPM, que genera el área con la mayor cantidad de información, ajusta el tamaño de la imagen y la envía a CNN para extraer características locales. por las dos últimas ramas se unen para obtener el resultado final
El módulo DRPM incluye cuatro módulos:
- Módulo de atención:
Explicación de la "parte en negrita"
Eliminar partes : primero convierta la imagen de tres canales en una imagen en escala de grises de un canal, luego realice una transformación morfológica en la imagen para eliminar el ruido, luego configure un núcleo de 17 * 17 para realizar la operación de sombrero negro para resaltar el contorno de la parte, y luego Realizar una operación de umbral, utilizándola para extraer objetos en imágenes para distinguir el fondo y las partes. El último paso es la operación de pintura, que restaura el daño a la imagen causado por los pasos anteriores. La operación de pintura es una imagen binaria obtenida en función de la operación de umbral. Los píxeles cerca del límite del área se utilizan para reconstruir los píxeles de la parte eliminada. La siguiente figura es un ejemplo antes (a) y después (b) de que se elimine el componente. :
Aumento de datos : el objetivo del aumento de datos es aumentar el número de categorías con menos muestras para que cada categoría esté relativamente equilibrada. Existen muchos métodos para mejorar los datos, como: ajuste de color, recorte aleatorio, volteo aleatorio y transformación radial. La siguiente es la representación de la mejora de datos: