Espacio material "llene los espacios en blanco": el MIT utiliza el aprendizaje profundo para resolver problemas de pruebas no destructivas

Resumen de contenidos: Las pruebas de materiales desempeñan un papel vital en la ingeniería, la ciencia y la fabricación. Los métodos tradicionales de inspección de materiales, como el corte y la inspección de reactivos químicos, son destructivos, consumen mucho tiempo y recursos. Recientemente, los científicos del MIT utilizaron el aprendizaje profundo para desarrollar una técnica que puede completar la información faltante y determinar aún más la estructura interna de los materiales a partir de observaciones de la superficie.
Palabras clave: detección de material de aprendizaje profundo CNN

Autor|daserney

Editor|Sanyang

Este artículo se publicó por primera vez en la plataforma pública HyperAI Super Neural WeChat ~

En el procesamiento de datos, a menudo se encuentra el desafío de recuperar una imagen completa a partir de imágenes borrosas o información parcial. Este tipo de desafío se denomina "problema inverso" (problema inverso) y no solo es común en el diagnóstico médico, sino que también ocurre con frecuencia en la ciencia de materiales. Si podemos completar de manera efectiva esta información faltante, será posible comprender de manera más completa y precisa las propiedades de los tejidos o materiales biológicos y así tomar decisiones más precisas.

Cómo detectar la estructura organizativa interna de los materiales de pruebas no destructivas ha desconcertado a muchos profesionales relacionados. Las pruebas no destructivas se refieren al uso de tecnología y equipos modernos para detectar la estructura interna de los materiales sin dañar ni afectar la organización interna y el rendimiento de los materiales. Si bien la detección se puede realizar mediante técnicas como los rayos X, estos métodos generalmente son costosos y requieren equipos voluminosos.

Con este fin, el estudiante de doctorado chino del MIT (Instituto de Tecnología de Massachusetts), Yang Zhenze, y el profesor Markus Buehler combinaron una variedad de arquitecturas de aprendizaje profundo para restaurar las partes faltantes del material a través de información limitada en casos 2D y 3D, y caracterizar aún más la estructura microscópica. .

En la actualidad, los resultados de la investigación se han publicado en la revista "Advanced Materials", titulado "Rellene el espacio en blanco: enfoques transferibles de aprendizaje profundo para recuperar información faltante del campo físico".

Los resultados de la investigación se han publicado en "Advanced Materials"

Dirección del papel:

https://onlinelibrary.wiley.com/doi/full/10.1002/adma.202301449

Resumen del experimento: combinación de modelos para "rellenar el rompecabezas en blanco"

La siguiente figura muestra el esquema general del estudio. En la imagen de la izquierda, los cubos grises son las piezas que faltan. En los casos 2D y 3D, respectivamente, se combinan dos modelos de IA para realizar la tarea. Los investigadores entrenaron el primer modelo de IA para "rellenar los huecos", recuperar el campo completo del campo enmascarado, entrenar el segundo modelo de IA para "resolver acertijos" y utilizar el campo completo restaurado como entrada para obtener de forma inversa la microestructura correspondiente a el material compuesto (microestructura).

Figura 1: Esquema general

Los investigadores utilizaron el análisis de elementos finitos (FEA) para calcular los campos de deformación y tensión de materiales compuestos 2D y 3D en condiciones específicas.

En el caso 2D, los investigadores crearon una cuadrícula simétrica de 8×8 que se utilizó para construir la geometría del compuesto (232 geometrías posibles en total). Posteriormente, se generaron aleatoriamente 1.000 microestructuras compuestas diferentes para ensayos de tracción uniaxial.

En el caso 3D, los investigadores utilizaron una cuadrícula de 2×4×4 para crear una microestructura de dos capas (232 geometrías posibles en total) y un compuesto de 4 capas usando una cuadrícula de 4×4×4 (264 geometrías posibles en total). Para mantener el mismo número de geometrías posibles que en el caso 2D, los investigadores eligieron una cuadrícula de 2 × 4 × 4 como base y generaron aleatoriamente 2000 geometrías diferentes para los cálculos FEA.

Visualización y preprocesamiento de datos.

En 2D, utilizando la herramienta de visualización Abaqus, los investigadores generaron imágenes de los campos de deformación y tensión obtenidos de FEA, representados por barras blancas y rojas. A continuación, recorte, cambie el tamaño y el color mediante el preprocesamiento de Python. El tamaño de la imagen después del preprocesamiento es 256×256. En una geometría o microestructura compuesta, los bloques rojos representan materiales blandos, mientras que los bloques blancos representan materiales rígidos. Los investigadores introdujeron máscaras de forma regular e irregular; las máscaras regulares son de forma cuadrada y su tamaño varía entre 96 y 128.

En el caso 3D, los investigadores recopilaron valores de deformación y tensión para cada elemento y luego los normalizaron para formar una matriz de 16×32×32×1. De manera similar al caso 2D, los contornos de los campos de deformación y tensión se visualizan utilizando código Python. Una secuencia de imágenes de campo se almacena en una matriz de 16 × 32 × 32 × 3, que se utiliza como representación de datos para entrenar y probar modelos de aprendizaje profundo. La visualización de la microestructura compuesta en 3D correspondiente fue la representación del volumen a través de la biblioteca Matplotlib.

Selección de modelo: GAN + ViViT + CNN

Este estudio utiliza una variedad de modelos de aprendizaje profundo, incluidas redes generativas adversas  (GAN), modelos ViViT basados ​​​​en transformadores y redes neuronales convolucionales (CNN).

  • GAN:  En la etapa de llenado de imágenes 2D, los investigadores utilizaron el modelo GAN, que se denomina la segunda versión del modelo DeepFill, que puede realizar imágenes de forma libre en la pintura.
  • ViViT:  En el caso 3D, los investigadores utilizaron el modelo ViViT basado en la arquitectura Transformer para llenar los vacíos.
  • CNN:  Después de obtener el campo completo, se adoptó el modelo CNN tanto en el caso 2D como en el 3D para establecer el vínculo inverso entre el comportamiento mecánico y la microestructura del material compuesto.

Resultados experimentales: ViViT + CNN logra una predicción perfecta

caso 2D

Para obtener el error de predicción, los investigadores trazaron un diagrama de dispersión de la tensión media prevista frente al valor real dentro del área enmascarada. La forma de la máscara se genera aleatoriamente. Como se muestra en la Figura c a continuación, dados 200 datos de prueba, el índice R2 alcanza 0,998, lo que indica que el modelo GAN tiene un rendimiento excelente.

Figura 2: Rendimiento del modelo en 2D

c: rendimiento del modelo GAN en imágenes acolchadas. La verdad fundamental muestra una alta concordancia con el valor previsto (R2 = 0,998).

d: Rendimiento del modelo CNN para reconocimiento geométrico. La figura muestra la distribución de la diferencia geométrica entre la verdad fundamental y los resultados previstos.

Además, los investigadores evaluaron el rendimiento del modelo CNN en reconocimiento geométrico calculando la diferencia geométrica. La diferencia de geometría es el número de bloques de material diferentes entre la serie verdadera y la predicha. Como se muestra en la Figura 2d, la mayoría de las secuencias predichas son idénticas a las secuencias reales, con una diferencia geométrica máxima de 0,0625 entre los 200 datos de prueba, y dos de los 32 bloques son diferentes. Si la imagen de campo recuperada es inexacta, el error geométrico aumentará. Por lo tanto, la predicción precisa del modelo CNN verifica aún más el alto rendimiento del modelo GAN.

situación 3D

En la práctica actual de la ingeniería, la microestructura de los compuestos 3D suele ser más compleja que la de los 2D. La siguiente figura muestra la comparación de 8 marcos de campo predichos y la verdad del terreno. Los resultados muestran que el modelo ViViT mejorado puede utilizar los campos mecánicos de una capa (del 1.º al 8.º fotograma) en el material compuesto para predecir con precisión el campo de otra capa (del 9.º al 16.º fotograma).

Figura 3: Predicciones del marco de campo para dos casos de compuestos bicapa.

Los primeros 8 fotogramas se toman como entrada y el modelo de aprendizaje profundo predice los 8 fotogramas restantes.

La Figura 4 muestra el error cuadrático medio (MSE) para los fotogramas 9 a 16 de los 200 datos de prueba. El MSE para cada punto de datos se obtiene calculando el promedio de las diferencias al cuadrado en los valores de píxeles entre los mapas de campo predichos y la verdad fundamental. El MSE general de los ocho fotogramas previstos es bajo y el MSE medio de todos los fotogramas está por debajo de 0,001, lo que demuestra el excelente rendimiento del modelo ViViT.

El error cuadrático medio (Error cuadrático medio, MSE) es un indicador comúnmente utilizado para evaluar la precisión de los modelos de pronóstico. En el proceso de pronóstico, MSE se utiliza para medir el grado de diferencia entre el valor previsto y el valor real. Cuanto menor sea el valor de MSE, mayor será la precisión del modelo predictivo.

Figura 4: Distribución de errores

A través del marco de campo previsto, se pueden utilizar los campos mecánicos 3D completos para determinar la microestructura del material compuesto. Al igual que en el caso 2D, los investigadores utilizaron un modelo CNN para hacer predicciones. Como se muestra en el panel superior derecho de la Figura 4, la diferencia de geometría es 0. Al combinar el modelo ViViT mejorado con el modelo CNN, se puede lograr la identificación precisa de la microestructura 3D interna y la mayoría de las formas geométricas se predicen perfectamente.

Laboratorio LAMM: Vinculación de la estructura y función del material

La investigación fue completada conjuntamente por el estudiante de doctorado chino Yang Zhenze y el profesor Markus Buehler del MIT. Zhenze Yang es un estudiante de doctorado en el MIT que trabaja en el Laboratorio de Mecánica Atómica y Molecular del MIT (LAMM). Sus intereses de investigación incluyen la combinación de técnicas de aprendizaje automático y aprendizaje profundo con métodos de simulación multiescala para acelerar el cálculo del rendimiento y el diseño de diversos materiales, como compuestos, nanomateriales y biomateriales. Antes de esto, Yang Zhenze obtuvo una licenciatura en física de la Universidad de la Academia de Ciencias de China.

Yang Zhenze y el profesor Markus Buehler

Sitio web personal de Yang Zhenze:

https://www.zhenzeyang.com/

Dirección del laboratorio:

http://lamm.mit.edu/

El autor correspondiente, Markus Buehler, es investigador principal de LAMM. La investigación académica de Markus Buehler es muy citada, con más de 450 publicaciones en ciencia computacional de materiales, biomateriales y nanotecnología. Uno de sus objetivos es utilizar la música y el diseño de sonido, combinados con inteligencia artificial, para simular, optimizar y crear nuevas formas de materia autónoma desde cero de forma abstracta, a través de escalas (por ejemplo, de nano a macro) y especies (por ejemplo, desde humanos hasta arañas).

LAMM se dedica a desarrollar un nuevo paradigma para diseñar materiales a partir de la escala molecular. Combinando los conceptos de ingeniería estructural, ciencia de materiales y biología, LAMM conecta la estructura química básica a escala atómica con la escala funcional e integra los conceptos de estructura y función al comprender cómo los materiales biológicos forman estructuras jerárquicas para lograr propiedades mecánicas superiores

Link de referencia:

[1] Los estudiantes de doctorado chinos del MIT desarrollan modelos de aprendizaje profundo, que pueden usarse para resolver problemas inversos en la investigación de materiales. Conozca casi

[2] El sistema de inteligencia artificial del MIT revela la estructura interna de los materiales a partir de observaciones de la superficie

[3] https://professional.mit.edu/programs/faculty-profiles/markus-j-buehler

Este artículo se publicó por primera vez en la plataforma pública HyperAI Super Neural WeChat ~

Supongo que te gusta

Origin blog.csdn.net/HyperAI/article/details/132540844
Recomendado
Clasificación