Resumo do conteúdo: Os testes de materiais desempenham um papel vital na engenharia, ciência e fabricação. Os métodos tradicionais de inspeção de materiais, como corte e inspeção de reagentes químicos, são destrutivos, demorados e intensivos em recursos. Recentemente, os cientistas do MIT usaram o aprendizado profundo para desenvolver uma técnica que pode preencher informações ausentes e determinar ainda mais a estrutura interna dos materiais a partir de observações de superfície.
Palavras-chave: detecção de material de aprendizagem profunda CNN
Autor|daserney
Editor|Sanyang
Este artigo foi publicado pela primeira vez na plataforma pública HyperAI Super Neural WeChat ~
No processamento de dados, muitas vezes é encontrado um desafio, ou seja, recuperar uma imagem completa a partir de imagens borradas ou informações parciais. Esse tipo de desafio é chamado de “problema inverso” (problema inverso) e não é comum apenas no diagnóstico médico, mas também ocorre com frequência na ciência dos materiais. Se pudermos preencher eficazmente estas informações em falta, poderá ser possível compreender de forma mais completa e precisa as propriedades dos tecidos ou materiais biológicos e, assim, tomar decisões mais precisas.
Como detectar a estrutura organizacional interna de materiais de testes não destrutivos tem intrigado muitos profissionais relacionados. Os testes não destrutivos referem-se ao uso de tecnologia e equipamentos modernos para detectar a estrutura interna dos materiais sem danificar ou afetar a organização interna e o desempenho dos materiais. Embora a detecção possa ser feita usando técnicas como raios X, esses métodos geralmente são caros e requerem equipamentos volumosos.
Para este fim, o estudante de doutorado chinês do MIT (Instituto de Tecnologia de Massachusetts), Yang Zhenze, e o professor Markus Buehler combinaram uma variedade de arquiteturas de aprendizagem profunda para restaurar as partes faltantes do material por meio de informações limitadas em casos 2D e 3D, e caracterizar ainda mais a estrutura microscópica. .
Atualmente, os resultados da pesquisa foram publicados na revista "Advanced Materials", intitulada "Preencher o espaço em branco: abordagens de aprendizagem profunda transferíveis para recuperar informações ausentes do campo físico".
Os resultados da pesquisa foram publicados em "Materiais Avançados"
Endereço do papel:
https://onlinelibrary.wiley.com/doi/full/10.1002/adma.202301449
Visão geral do experimento: combinação de modelos para "preencher o quebra-cabeça em branco"
A figura abaixo mostra o esquema geral do estudo. Na imagem à esquerda, os cubos cinza são as peças que faltam. Nos casos 2D e 3D, respectivamente, dois modelos de IA são combinados para realizar a tarefa. Os pesquisadores treinaram o primeiro modelo de IA para “preencher as lacunas”, recuperar o campo completo do campo mascarado, treinar o segundo modelo de IA para “resolver quebra-cabeças” e usar o campo completo restaurado como entrada para obter inversamente a microestrutura correspondente a o material compósito (microestrutura).
Figura 1: Esquema Geral
Os pesquisadores usaram a Análise de Elementos Finitos (FEA) para calcular os campos de deformação e tensão de materiais compósitos 2D e 3D sob condições específicas.
No caso 2D, os pesquisadores criaram uma grade simétrica 8×8 que foi usada para construir a geometria do compósito (232 geometrias possíveis no total). Posteriormente, 1.000 microestruturas compostas diferentes foram geradas aleatoriamente para testes de tração uniaxial.
No caso 3D, os pesquisadores usaram uma grade 2×4×4 para criar uma microestrutura de duas camadas (232 geometrias possíveis no total) e um composto de 4 camadas usando uma grade 4×4×4 (264 geometrias possíveis no total). Para manter o número de geometrias possíveis igual ao caso 2D, os pesquisadores escolheram uma grade 2×4×4 como linha de base e geraram aleatoriamente 2.000 geometrias diferentes para cálculos FEA.
Visualização e pré-processamento de dados
Em 2D, por meio da ferramenta de visualização Abaqus, os pesquisadores geraram imagens dos campos de deformação e tensão obtidos no FEA, representados por barras brancas e vermelhas. Em seguida, corte, redimensione e recolora por meio do pré-processamento Python. O tamanho da imagem após o pré-processamento é 256×256. Em uma geometria ou microestrutura composta, os blocos vermelhos representam materiais macios, enquanto os blocos brancos representam materiais rígidos. Os pesquisadores introduziram máscaras de formato regular e irregular, as máscaras regulares têm formato quadrado, variando em tamanho de 96-128.
No caso 3D, os pesquisadores coletaram valores de deformação e tensão para cada elemento e depois os normalizaram para formar uma matriz 16×32×32×1. Semelhante ao caso 2D, os contornos dos campos de deformação e tensão são visualizados usando código Python. Uma sequência de imagens de campo é armazenada em uma matriz 16×32×32×3, que é usada como representação de dados para treinamento e teste de modelos de aprendizado profundo. A visualização da microestrutura composta 3D correspondente foi a renderização de volume por meio da biblioteca Matplotlib.
Seleção de modelo: GAN + ViViT + CNN
Este estudo usa uma variedade de modelos de aprendizagem profunda, incluindo Redes Adversariais Generativas (GAN), modelos ViViT baseados em transformadores e Redes Neurais Convolucionais (CNN).
- GAN: Na etapa de preenchimento de imagens 2D, os pesquisadores utilizaram o modelo GAN, que é chamado de segunda versão do modelo DeepFill, que pode realizar pintura de imagens de forma livre.
- ViViT: No caso 3D, os pesquisadores usaram o modelo ViViT baseado na arquitetura Transformer para preencher as lacunas.
- CNN: Após a obtenção do campo completo, o modelo CNN foi adotado tanto no caso 2D quanto no 3D para estabelecer a ligação inversa do comportamento mecânico à microestrutura do material compósito.
Resultados experimentais: ViViT + CNN alcança previsão perfeita
Caso 2D
Para obter o erro de previsão, os pesquisadores traçaram um gráfico de dispersão da média de tensão prevista versus o valor real dentro da área mascarada. A forma da máscara é gerada aleatoriamente. Conforme mostrado na Figura c abaixo, dados 200 dados de teste, o índice R2 atinge 0,998, indicando que o modelo GAN possui excelente desempenho.
Figura 2: Desempenho do modelo em 2D
c: Desempenho do modelo GAN em imagens preenchidas. A verdade básica mostra alta concordância com o valor previsto (R2 = 0,998).
d: Desempenho do modelo CNN para reconhecimento geométrico. A figura mostra a distribuição da diferença geométrica entre a verdade básica e os resultados previstos.
Além disso, os pesquisadores avaliaram o desempenho do modelo CNN no reconhecimento geométrico por meio do cálculo da diferença geométrica. A diferença geométrica é o número de diferentes blocos de material entre as séries verdadeira e prevista. Conforme mostrado na Figura 2d, a maioria das sequências previstas são idênticas às sequências reais, com uma diferença geométrica máxima de 0,0625 entre todos os 200 dados de teste, e dois dos 32 blocos são diferentes. Se a imagem do campo recuperada for imprecisa, o erro geométrico aumentará. Portanto, a previsão precisa do modelo CNN verifica ainda mais o alto desempenho do modelo GAN.
Situação 3D
Na prática real de engenharia, a microestrutura dos compósitos 3D é geralmente mais complexa do que a dos 2D. A figura abaixo mostra a comparação de 8 quadros de campo previstos e informações básicas. Os resultados mostram que o modelo ViViT aprimorado pode usar os campos mecânicos de uma camada (1º ao 8º quadro) no material compósito para prever com precisão o campo de outra camada (9º ao 16º quadro).
Figura 3: Previsões de quadros de campo para dois casos de compósitos de bicamada.
Os primeiros 8 quadros são considerados como entrada e os 8 quadros restantes são previstos pelo modelo de aprendizado profundo.
A Figura 4 mostra o erro quadrático médio (MSE) para os quadros 9 a 16 de todos os 200 dados de teste. O MSE para cada ponto de dados é obtido calculando a média das diferenças quadradas nos valores de pixel entre os mapas de campo previstos e a verdade básica. O MSE geral dos oito quadros previstos é baixo, e o MSE médio de todos os quadros está abaixo de 0,001, mostrando o excelente desempenho do modelo ViViT.
O erro quadrático médio (Erro quadrático médio, MSE) é um indicador comumente usado para avaliar a precisão dos modelos de previsão. No processo de previsão, o MSE é usado para medir o grau de diferença entre o valor previsto e o valor real. Quanto menor o valor do MSE, maior será a precisão do modelo preditivo.
Figura 4: Distribuição de erros
Através do quadro de campo previsto, os campos mecânicos 3D completos podem ser usados para determinar a microestrutura do material compósito. Semelhante ao caso 2D, os pesquisadores usaram um modelo CNN para fazer previsões. Conforme mostrado no painel superior direito da Fig. 4, a diferença geométrica é 0. Ao combinar o modelo ViViT aprimorado com o modelo CNN, a identificação precisa da microestrutura 3D interna pode ser alcançada, e a maioria das formas geométricas são perfeitamente previstas .
Laboratório LAMM: Vinculando Estrutura e Função do Material
A pesquisa foi concluída em conjunto pelo estudante de doutorado chinês Yang Zhenze e pelo professor Markus Buehler do MIT. Zhenze Yang é estudante de doutorado no MIT e trabalha no Laboratório de Mecânica Atômica e Molecular do MIT (LAMM). Os interesses de pesquisa incluem a combinação de técnicas de aprendizado de máquina e aprendizado profundo com métodos de simulação multiescala para acelerar o cálculo de desempenho e o projeto de vários materiais, como compósitos, nanomateriais e biomateriais. Antes disso, Yang Zhenze recebeu o diploma de bacharel em física pela Universidade da Academia Chinesa de Ciências.
Yang Zhenze e Prof.
Site pessoal de Yang Zhenze:
Endereço do laboratório:
O autor correspondente, Markus Buehler, é o investigador principal do LAMM. A pesquisa acadêmica de Markus Buehler é altamente citada, com mais de 450 publicações em ciência computacional de materiais, biomateriais e nanotecnologia. Um dos seus objetivos é usar música e design de som, combinados com inteligência artificial, para simular, otimizar e criar novas formas de matéria autônoma a partir do zero, de forma abstrata, em escalas (por exemplo, de nano a macro) e espécies (por exemplo, de humanos a aranhas).
A LAMM dedica-se a desenvolver um novo paradigma para projetar materiais a partir da escala molecular. Combinando os conceitos de engenharia estrutural, ciência dos materiais e biologia, o LAMM conecta a estrutura química básica em escala atômica com a escala funcional e integra os conceitos de estrutura e função ao compreender como os materiais biológicos formam estruturas hierárquicas para alcançar propriedades mecânicas superiores
Link de referência:
[3] https://professional.mit.edu/programs/faculty-profiles/markus-j-buehler
Este artigo foi publicado pela primeira vez na plataforma pública HyperAI Super Neural WeChat ~