La Universidad Jiaotong de Shanghai publica el conjunto de datos de análisis de imágenes médicas MedMNIST y un nuevo punto de referencia

Por Super Nervous

Resumen del contenido: El análisis de imágenes médicas es un campo interdisciplinario muy complejo. Recientemente, la Universidad Jiaotong de Shanghai publicó el conjunto de datos MedMNIST, que se espera que promueva el desarrollo del análisis de imágenes médicas.

Palabras clave: análisis de imágenes médicas, conjunto de datos públicos

 Análisis de imágenes médicas calvas

El análisis de imágenes médicas es un tema de "viejo problema" bien reconocido.

En primer lugar, es un campo interdisciplinario que requiere que los profesionales tengan una amplia gama de conocimientos. Incluso si usted es un profesional que estudia visión por computadora o un practicante de medicina clínica, en el mejor de los casos, solo puede tomar la mitad del análisis de imágenes médicas. pie.

Con optimismo, después de años de estudio e investigación, finalmente has dominado las habilidades bidireccionales de la visión artificial y la medicina clínica. Entonces las siguientes operaciones también harán que te preocupes por la calvicie, porque estas fuentes de datos son diversas, incluyendo rayos X, TC, ultrasonido ... … ¡ Analizar y procesar tantos conjuntos de datos no estándar con diferentes modos es demasiado difícil!

Esto aún no ha terminado. Aunque el aprendizaje profundo ha tomado una posición dominante en la investigación y aplicación del análisis de imágenes médicas, el costo de mano de obra requerido para el ajuste del modelo es demasiado alto. AutoML es fácil de usar, pero básicamente no se utiliza una clasificación de imágenes médicas actualmente. Comparativa de AutoML.

Decatlón de categoría MedMNIST de un vistazo

El análisis de imágenes médicas es difícil, pero el conjunto de datos MedMNIST publicado recientemente por la Universidad Jiaotong de Shanghai ha aportado una gran arma para acabar con estos viejos y difíciles problemas.

 10 conjuntos de datos públicos, 450.000 imágenes reorganizadas

MedMNIST es una colección de 10 conjuntos de datos médicos públicos, y todos los datos han sido preprocesados ​​y divididos en conjuntos de datos estándar que incluyen el conjunto de entrenamiento, el conjunto de validación y el subconjunto de pruebas. Las fuentes de datos incluyen rayos X, OCT, ultrasonido, CT y otros modos de imagen diferentes, y se obtuvieron datos multimodales de la misma lesión. Al igual que el conjunto de datos MNIST, MedMNIST puede realizar tareas de clasificación en imágenes ligeras de 28 * 28.

Patrón de datos, tareas aplicables y número de imágenes para diez conjuntos de datos

MedMNIST tiene las siguientes características:

Educativo: los datos multimodales provienen de múltiples conjuntos de datos de imágenes médicas públicas, utilizando un acuerdo de licencia Creative Commons (CC) o un acuerdo de licencia libre para facilitar el uso educativo .

Estandarización: todos los datos se han procesado previamente en el mismo formato, lo que reduce las barreras de entrada y puede ser utilizado por cualquier persona.

Diversidad: el conjunto de datos multimodal cubre diferentes patrones de datos, y el tamaño de los datos se admite de 100 a 100.000. Los tipos de tareas también son ricos en clasificación binaria, clasificación de clases múltiples, regresión ordenada y etiquetas múltiples.

Ligero: el tamaño de imagen de 28 * 28 facilita la creación rápida de prototipos y la iteración y experimentación rápidas de aprendizaje automático multimodal y algoritmos de AutoML.

Conjunto de datos de MedMNIST

Agencia emisora: Universidad Jiaotong de Shanghai

Contiene el número: 454,591 datos de imagen

Formato de datos: NPZ

Tamaño de los datos: 654 MB

Fecha de lanzamiento: 28 de octubre de 2020

Enlace de descarga: http://dwz.date/dew2

 Decathlon es bueno, crea un nuevo punto de referencia para AutoML 

Inspirándose en el "Decathlon de segmentación médica" (Decathlon de segmentación médica), los investigadores de la Universidad Jiaotong de Shanghai también lanzaron el "Decathlon de clasificación MedMNIST" (Decathlon de clasificación MedMNIST) como un punto de referencia ligero de AutoML en la clasificación de imágenes médicas.

Los investigadores utilizaron MedMNIST para clasificar el decatlón, evaluaron el rendimiento del algoritmo en los 10 conjuntos de datos y adoptaron varios otros métodos de referencia para compararlos con el punto de referencia. Estos métodos incluyen ResNets (18, 50), auto-sklearn, AutoKeras, Google AutoML Vision.

Descripción general del desempeño de MedMNIST en indicadores como AUC y ACC

Los resultados experimentales muestran que para los 10 conjuntos de datos, no existe en el experimento un algoritmo que pueda lograr un buen rendimiento de generalización. Este experimento es de gran importancia para explorar un algoritmo de AutoML bien generalizado en diferentes modos de datos, tipos de tareas y escalas de datos.

La prueba comparativa de decatlón de clasificación MedMNIST promoverá la investigación futura en AutoML para el análisis de imágenes médicas.

Papeles relacionados:

https://arxiv.org/pdf/2010.14925.pdf

Dirección de fuente abierta:

https://github.com/MedMNIST/MedMNIST

 Descargue el conjunto de datos ahora y comience su entrenamiento

Descargue el conjunto de datos y entrene el modelo de aprendizaje automático en línea. Puede comenzar su práctica a través de OpenBayes.

OpenBayes es una plataforma de servicios en la nube que proporciona potencia de computación en la nube para el aprendizaje automático. Tiene un clúster de supercomputación a gran escala, admite múltiples configuraciones de recursos de potencia de computación de GPU y CPU, y tiene un sistema de modelado de aprendizaje automático de uso general listo para usar. No se requiere experiencia en aprendizaje automático para construir rápidamente sistemas inteligentes.

En la actualidad, los productos de contenedor de potencia informática de OpenBayes ya son compatibles con  TensorFlow, PyTorch, MXNet, Darknet, cpp-development y otros entornos de CPU y GPU , diferentes versiones y tipos de marcos de aprendizaje de máquina estándar y varias dependencias comunes.

Al mismo tiempo, OpenBayes también proporciona una  variedad de recursos informáticos como CPU, NVIDIA T4, NVIDIA Tesla V100, etc. , ya sea un entrenamiento centralizado de datos masivos o una operación permanente de modelos de bajo consumo, puede satisfacer fácilmente las necesidades del usuario.

En la actualidad, el conjunto de datos MedMNIST se ha lanzado en OpenBayes.

Visite openbayes.com 

Registra un nuevo usuario con el código de invitación [HyperAI]

Puede disfrutar

240 min de CPU + 180 min de NVIDIA vGPU por semana 

Potencia informática gratuita ~

Visite el enlace a continuación o haga clic para leer el texto original y comenzar su viaje de exploración de MedMNIST.

Enlace: http://dwz.date/dew2

-- Terminar--

Escanee el código QR para unirse al grupo de discusión

Obtenga más conjuntos de datos de alta calidad

Comprender la aplicación de la inteligencia artificial.

Siga las principales conferencias y ponencias

Responde al "lector" para obtener más información

Más contenido interesante (haga clic en la imagen para leer)

Supongo que te gusta

Origin blog.csdn.net/HyperAI/article/details/109589817
Recomendado
Clasificación