Análisis de imágenes médicas con técnicas de aprendizaje profundo

Autor: Zen y el arte de la programación informática

1. Introducción

Análisis de imágenes médicas 2D

Al realizar análisis bidimensionales de imágenes médicas, es necesario realizar procesos como preprocesamiento de imágenes, extracción de características, entrenamiento de modelos y generación de clasificadores. Con el rápido desarrollo de la tecnología de visión por computadora en los últimos años, la tecnología basada en el aprendizaje profundo ha atraído cada vez más atención. El aprendizaje profundo ha logrado buenos resultados en el campo del reconocimiento de imágenes, pero la información estructural de las imágenes médicas es difícil de analizar directamente utilizando métodos tradicionales de aprendizaje automático. Por lo tanto, cómo combinar la tecnología de aprendizaje profundo y sus características de imágenes médicas para lograr un análisis de imágenes médicas más eficiente, exacto y preciso se ha convertido en uno de los puntos críticos de investigación durante mucho tiempo.

Con la popularización de las aplicaciones de imágenes médicas, es necesario recopilar, organizar, almacenar y gestionar diversos tipos de datos que a menudo intervienen en el análisis de imágenes médicas. Actualmente, la recopilación de datos de imágenes médicas se lleva a cabo mediante registros médicos profesionales, pero este método aún presenta ciertas deficiencias. Además, también existen dificultades en el almacenamiento de datos de imágenes médicas, incluida la copia de seguridad, clasificación, archivo, etc., que requieren participación profesional. Por lo tanto, en este sentido, se puede considerar la creación de una plataforma todo en uno que pueda integrar, comunicar y gestionar diferentes tipos de fuentes de datos para facilitar la recopilación, el almacenamiento, el intercambio y el análisis de imágenes médicas.

Este artículo primero analiza algunos principios básicos de los datos de imágenes médicas y luego combina tecnología de aprendizaje profundo para presentar en detalle las tecnologías comúnmente utilizadas en el análisis de imágenes médicas, como el preprocesamiento de imágenes, la extracción de características, el entrenamiento de modelos, la generación de clasificadores, etc. Finalmente, se prospecta la dirección del desarrollo futuro y se prevé un modelo de análisis de imágenes médicas más saludable y eficaz.

2. Descripción general de los datos de imágenes médicas 2D

2.1 Tipos de datos de imágenes médicas

En términos generales, los datos de imágenes médicas incluyen los siguientes tipos:

  1. Imagen médica de corte: Es un conjunto de imágenes de corte continuo en las que el dispositivo de corte se mueve en la misma dirección;
  2. Imagen de contraste (CT): la imagen de CT se compone de exploraciones meteorológicas tisulares de varios tejidos y órganos, y se compone de secciones de tejido en diferentes puntos temporales;
  3. Imágenes de rayos X: Las fotografías de rayos X se obtienen a partir de rayos de material radiactivo. Cuantos más píxeles tenga una imagen de rayos X, más información contiene;
  4. Imagen de ultrasonido: generalmente se utiliza para el análisis de muestras de secado ultrasónico, adhesión y permeabilidad intraquística;
  5. Imágenes de resonancia magnética magnética: se utilizan para monitorear la morfología, la actividad fisiológica y los cambios patológicos de los tejidos fuera del cuerpo o de las estructuras tisulares circundantes del cuerpo.

La imagen médica 2D se muestra en la figura anterior y contiene múltiples regiones de interés y regiones sin interés. Cada región de interés suele corresponder a un tejido o estructura diferente, y su ubicación y tamaño dependen de factores como el dispositivo de exploración y el movimiento del paciente. La distribución de los diferentes tejidos en la imagen muestra formas complejas y, a menudo, existen similitudes entre varios tejidos y estructuras. El área que no es de interés suele contener información como bordes y fondo.

2.2 Características de los datos de imágenes médicas

Además de tener estructuras bidimensionales y tridimensionales, los datos de imágenes médicas también tienen las siguientes características importantes:

  1. Rica información espacial: debido a la existencia de una estructura tridimensional, los datos de imágenes médicas contienen una gran cantidad de información espacial, que incluye información frontal, posterior, izquierda, derecha, arriba y abajo, organización jerárquica e información ambiental;
  2. Grandes diferencias de resolución: los datos de imágenes médicas suelen adoptar una resolución más alta, para que puedan reflejar los detalles y la información de textura de la microestructura;
  3. Diversidad de píxeles: los datos de imágenes médicas contienen una variedad de píxeles, incluidas masas, paredes de tejido, marcadores fisiológicos anormales y otras señales in vitro recopiladas durante el proceso de producción de imágenes, etc.;
  4. Desequilibrio de datos: los datos de imágenes médicas a menudo tienen una distribución de desequilibrio extremo, y los casos positivos y negativos pueden llegar incluso al orden de miles de veces.

2.3 Desafíos de los datos de imágenes médicas

Los desafíos de los datos de imágenes médicas incluyen principalmente tres aspectos:

  1. Diversidad: incluye varias fuentes de luz, condiciones de estimulación, estructuras organizativas, modos de movimiento, escenas naturales y otras señales diversas mezcladas;
  2. Complejidad del modelo: para modelos complejos, la falta de datos de entrenamiento, el desequilibrio de ejemplos positivos y negativos y los parámetros del modelo excesivos y no escasos causarán dificultades computacionales;
  3. Baja densidad de información: las imágenes mostradas en las pantallas de las computadoras a menudo tienen muy poca información de píxeles, por lo que se necesita algún mecanismo de procesamiento de información para extraer características importantes y convertirlas en representaciones de imágenes legibles.

3. Preprocesamiento de datos de imágenes médicas.

3.1 Extracción de información del canal

Durante el proceso de recopilación de señales originales de datos de imágenes médicas, se generará información mixta entre diferentes bandas. Por lo tanto, para extraer señales de diferentes tejidos, los datos deben dividirse primero en canales para separar señales en diferentes rangos de espectro. Los datos de imágenes médicas generalmente consisten en espectros de color rojo, verde, azul, índigo y otros colores mezclados, por lo que el método de división de canales también es relativamente flexible.

3.2 Ajuste de contraste

El contraste se refiere a la relación entre el valor de brillo de los píxeles de la imagen y el fondo negro. Si el contraste de la imagen es demasiado bajo, puede causar distorsión en tareas como la detección y clasificación de características de la imagen. El ajuste del contraste puede solucionar este problema. El contraste se puede ajustar de dos maneras:

  1. Ecualización de histograma: el método de ecualización de histograma consiste en describir la distribución de cada píxel de la imagen con una determinada función de distribución de probabilidad y luego restablecer el valor de gris de la imagen de acuerdo con esta función para que la distribución de todos los píxeles se vuelva suave y incluso. La ecualización del histograma puede eliminar la inconsistencia en el contraste de luz y oscuridad causada por la influencia de fuentes de luz y también puede mejorar la solidez de la imagen.
  2. Ecualización de histograma local: la ecualización de histograma local es una técnica para ecualizar el contraste dentro de una región de interés. No requiere un histograma global, sino solo el histograma de una determinada ventana (región) en la imagen. El gráfico se puede ecualizar.

3.3 Reducción de ruido

El ruido se refiere a señales en las que se producen errores en la ruta de propagación de la señal analógica, como desenfoque, residuos, infiltración, reverberación, etc. La eliminación de ruido de los datos de imagen puede comenzar desde los dos aspectos siguientes:

  1. Filtrado: el filtrado es un método común de reducción de ruido, que incluye filtrado gaussiano, filtrado mediano, filtrado medio, filtrado bidireccional, etc. Mediante el filtrado, se puede eliminar o reducir el ruido de la señal analógica y mejorar la calidad de la imagen.
  2. Desempañado: El desempañado es un método de reducción de ruido basado en las características estadísticas de la imagen. Elimina la influencia del fondo, las nubes, la neblina y otros objetos modelando las reglas estadísticas del valor de gris de la imagen. La desempañamiento tiene un buen efecto, pero tiene ciertos requisitos para la imagen: por ejemplo, la imagen debe tener una buena estructura y sin gradientes obvios, y debe poder determinar automáticamente si la imagen es adecuada para desempañarla.

4. Extracción de funciones de datos de imágenes médicas.

La extracción de características se refiere a la extracción de características significativas y representativas de los datos de imágenes médicas, que pueden usarse para el análisis de imágenes médicas. Por lo general, la extracción de características incluye tres etapas: extracción de características locales, extracción de características globales y extracción de características a múltiples escalas.

4.1 Extracción de características locales

La extracción de características locales se refiere a extraer características de la imagen de la vecindad de un solo píxel o área geométrica. Aunque este método es simple y fácil de entender, a menudo cuenta todas las características locales en toda la imagen, por lo que la capacidad expresiva de las características es relativamente débil.

Las características de las imágenes 2D incluyen bordes, esquinas, parches, etc., que se pueden obtener mediante operaciones como erosión y dilatación. La red neuronal convolucional (CNN) se puede utilizar para la extracción de características, en la que las operaciones de agrupación y reparto de peso pueden reducir eficazmente la cantidad de parámetros y el uso de memoria.

4.2 Extracción de características globales

La extracción de características globales se refiere a la extracción de características de las características estadísticas de la imagen general. Las características globales a menudo pueden capturar información contextual de toda la imagen y proporcionar una expresión general de las características de la imagen.

Hay muchas características globales de las imágenes, como la longitud del borde, el ancho, la dirección, la curvatura, las características morfológicas, etc. Las características globales se pueden extraer desde ángulos como el color, la posición espacial y la textura.

4.3 Extracción de características multiescala

La extracción de características multiescala se refiere a la extracción de características de imágenes de diferentes escalas y la fusión a través de diferentes niveles de información de la imagen. Como transformada de Fourier multiescala, pirámide morfológica, transformada radial, etc. Este método puede mejorar el rendimiento de la extracción de características, retener diferentes características en diferentes escalas y reducir los errores de posicionamiento espacial.

5. Entrenamiento modelo de datos de imágenes médicas.

5.1 Estructura del modelo CNN

En CNN, las capas convolucionales, las capas de agrupación y las capas completamente conectadas generalmente se conectan en serie y luego se entrenan mediante retropropagación. Las capas convolucionales más utilizadas son:

  1. Núcleo de convolución 3 x 3: realiza operaciones de convolución en áreas adyacentes de la imagen, lo que equivale al filtrado de imágenes;
  2. Núcleo de convolución 5 x 5: realiza operaciones de convolución en áreas adyacentes de la imagen;
  3. Núcleo de convolución 7 x 7: realiza operaciones de convolución en áreas adyacentes de la imagen;

Las capas de agrupación más utilizadas son:

  1. Agrupación máxima: tome el valor máximo en la ventana de agrupación como valor de salida;
  2. Agrupación promedio: tome el valor promedio en la ventana de agrupación como valor de salida;

5.2 Ampliación y sobreajuste de datos

Debido al desequilibrio del conjunto de datos y a los problemas de sobreajuste, el entrenamiento del modelo suele ser muy difícil. Para resolver este problema, se puede utilizar el aumento de datos. Los métodos de expansión de datos incluyen:

  1. Muestreo de distribución de probabilidad: seleccione aleatoriamente muestras del conjunto de datos y luego copie, gire, recorte, cambie el brillo, etc.;
  2. Generación de imágenes naturales: genere nuevas imágenes diseñadas por el propio modelo y agréguelas al conjunto de entrenamiento;
  3. Aprendizaje semisupervisado: utilice datos etiquetados para entrenar el modelo, mientras entrena datos sin etiquetar, y utilice datos sin etiquetar para ayudar al modelo a mejorar su capacidad de generalización;
  4. Aprendizaje conjunto: mejore la solidez y la solidez del modelo construyendo múltiples modelos y promediando o votando sus resultados de salida.

5.3 Conjunto de validación y conjunto de prueba

Al entrenar el modelo, es necesario dividir el conjunto de validación y el conjunto de prueba. El conjunto de validación se utiliza para evaluar el rendimiento del modelo y seleccionar los parámetros óptimos del modelo durante el proceso de iteración, y el conjunto de prueba se utiliza para demostrar la capacidad de generalización del modelo. La división del conjunto de verificación debe determinarse en función de las condiciones comerciales reales.

6. Generación de clasificador para datos de imágenes médicas.

Un clasificador es un algoritmo que predice a qué clase pertenece una imagen en función de sus características. Actualmente, los clasificadores se pueden dividir en clasificadores supervisados ​​y clasificadores no supervisados.

6.1 Clasificadores supervisados

A un clasificador supervisado se le asigna una etiqueta para una imagen y luego utiliza un modelo de clasificación para clasificar la imagen. Los modelos típicos de clasificadores supervisados ​​son:

  1. Máquina de vectores de soporte (SVM): SVM se desempeña bien en tareas de clasificación, admite la forma de funciones del núcleo y puede modelar problemas no lineales;
  2. Naive Bayes: Naive Bayes es un método de clasificación basado en la teoría de la probabilidad, que supone que cada categoría obedece a una distribución multinomial y es independiente entre sí. Por lo tanto, NB puede resolver eficazmente problemas de múltiples etiquetas de alta dimensión.
  3. Árbol de decisión: el árbol de decisión es un método de clasificación que divide el espacio de características en regiones inconexas y predice la variable objetivo en función de los atributos de la región. El proceso de formación del árbol de decisiones es un proceso recursivo hasta que ya no se puede dividir;

6.2 Clasificador no supervisado

Un clasificador no supervisado no proporciona la etiqueta de la imagen, solo utiliza un algoritmo de agrupamiento o un algoritmo de inferencia de densidad para agrupar las imágenes y luego clasificarlas. Los modelos típicos de clasificadores no supervisados ​​son:

  1. Algoritmo K-Means: K-Means es un algoritmo de aprendizaje no supervisado que determina el resultado final de agrupación en función del número k de centros de agrupación de muestra. La ventaja de K-Means es que es rápido y fácil de implementar, pero no puede encontrar la solución óptima global.
  2. Algoritmo DBSCAN: DBSCAN es un algoritmo de aprendizaje no supervisado basado en agrupamiento de densidad. DBSCAN tiene como objetivo descubrir posibles estructuras de agrupación escaneando el conjunto de datos y buscando objetos centrales y objetos límite para construir agrupaciones.

7. Dirección del desarrollo futuro

Los datos de imágenes médicas también enfrentarán muchos desafíos en el proceso de desarrollo, tales como:

  1. Escalabilidad: la disponibilidad de datos de imágenes médicas sigue aumentando, pero las herramientas relacionadas requieren un mayor desarrollo;
  2. Falta de estándares: los datos de imágenes médicas vienen en una variedad de formatos y atributos y, a menudo, carecen de estándares unificados;
  3. Protección de la privacidad: la privacidad personal de los datos de imágenes médicas se ha convertido en un nuevo tema delicado;
  4. Heterogeneidad espaciotemporal: personas de diferentes países y regiones utilizan el mismo equipo para tomar imágenes médicas y la distribución espaciotemporal de los datos también es muy inconsistente;
  5. Limitaciones de los recursos informáticos: la magnitud de los datos de imágenes médicas es muy grande, por lo que el análisis y el procesamiento específicos requieren una gran cantidad de recursos informáticos;

Para un mejor análisis de datos de imágenes médicas, la tecnología de aprendizaje profundo puede desempeñar un papel en la integración efectiva de las características y desafíos de los datos de imágenes médicas. En este sentido, las últimas tecnologías en aprendizaje automático, visión por computadora, reconocimiento de patrones, gestión de bases de datos y otros campos se pueden utilizar para ayudar a superar los obstáculos en el campo de las imágenes médicas.

Supongo que te gusta

Origin blog.csdn.net/universsky2015/article/details/133446327
Recomendado
Clasificación