Abaixo, apresentarei a rede neural de conhecimento de física incorporada (PINN) para resolver equações diferenciais. Primeiro, o método básico do PINN é introduzido e, com base na estrutura de solução PINN de Pytorch, a equação unidimensional do hambúrguer com termo de tempo é resolvida.

Rede neural de conhecimento físico incorporado (PINN) Introdução e documentos relacionados
Aprendizagem profunda para resolver equações diferenciais Série 1: Estrutura de solução PINN (Poisson 1d)
Aprendizagem profunda para resolver equações diferenciais Série 2: PINN para resolver problemas avançados de equações de hambúrguer
Aprendizagem profunda para resolver equações diferenciais Série 3: PINN resolve o problema inverso da equação do hambúrguer
Deep learning para resolver a equação diferencial série IV: Baseado na função de ativação adaptativa PINN resolve o problema inverso da equação do hambúrguer
Deep learning para resolver a equação diferencial série V: PINN resolve o problema direto e inverso da equação de Navier-Stokes

1. Introdução ao PINN

Como uma poderosa ferramenta de processamento de informações, a rede neural tem sido amplamente utilizada nas áreas de visão computacional, biomedicina e engenharia de petróleo e gás, desencadeando mudanças tecnológicas em muitos campos. A rede de aprendizagem profunda tem uma capacidade de aprendizagem muito forte, não só pode descobrir leis físicas, mas também resolver equações diferenciais parciais. Nos últimos anos, a solução de equações diferenciais parciais com base em aprendizado profundo tornou-se um novo foco de pesquisa. A rede neural informada pela física incorporada (PINN) é uma aplicação de máquinas científicas no domínio numérico tradicional, que pode ser usada para resolver vários problemas relacionados a equações diferenciais parciais (PDE), incluindo resolução de equações, inversão de parâmetros, descoberta de modelos, controle e otimização etc

2. Método PINN

A ideia principal do PINNN é mostrada na Figura 1, primeiro construa um resultado de saída como $\hat{u}$ 's rede neural, que é usada como um modelo proxy para a solução PDE, e a informação PDE é usada como uma restrição, codificada na função de perda de rede neural para treinamento. A função de perda inclui principalmente quatro partes: perda de estrutura diferencial parcial (perda de PDE), perda de condição de valor de contorno (perda de BC), perda de condição de valor inicial (perda de IC) e perda de condição de dados reais (perda de dados).
insira a descrição da imagem aqui

Figura 1: Diagrama esquemático do PINN

Em particular, considere o seguinte problema de EDP, onde a solução da EDP $u (x)$ 在 $\Omega \subset \mathbb{R}^{d}$ definição, onde $\mathbf{x}=\left(x_{1}, \ldots, x_{d}\right)$ ：
$f\left( \mathbf{x} ; \frac{\parcial u}{\parcial x_{1}}, \ldots, \frac{\parcial u}{\parcial x_{d}} ; \frac{\parcial^{2} u}{\parcial x_{1} \parcial x_{1}}, \ldots, \frac{\parcial^{2} u}{\parcial x_{1} \parcial x_{d}} \direita)=0 , \quad \mathbf{x} \in \Omega$
mesmo tempo, satisfaça o seguinte limite
$\mathcal{B}(u, \mathbf{x})=0 \quad \text { on } \quad \partial \Omega$

O processo de solução PINN inclui principalmente:

O primeiro passo é definir o modelo de rede neural da camada totalmente conectada da camada D:
$N_{\Theta}:=L_D \circ \ sigma \circ L_{D-1} \circ \sigma \circ \cdots \circ \sigma \circ L_1$
式中：
$\begin{aligned} L_1(x) &:=W_1 x+b_1, \quad W_1 \in \mathbb{R}^{d_1 \times d}, b_1 \in \mathbb{R}^{d_1} \\ L_i (x) &:=W_i x+b_i, \quad W_i \in \mathbb{R}^{d_i \times d_{i-1}}, b_i \in \mathbb{R}^{d_i}, \forall i =2,3, \cdots D-1, \\ L_D(x) &:=W_D x+b_D, \quad W_D \in \mathbb{R}^{N \times d_{D-1}}, b_D \ em \mathbb{R}^N . \end{alinhado}$
e $\sigma$ é a função de ativação, $W$ e $b$ são os parâmetros de ponderação e viés.
A segunda etapa, para medir a rede neural $\hat{u}$ (
$\mathcal{L}\left(\boldsymbol{\theta}\right)=w_{f} \mathcal{L}_{PDE}\left(\boldsymbol{\theta}; \mathcal{ T}_{f}\direita)+w_{i} \mathcal{L}_{IC}\left(\boldsymbol{\theta} ; \mathcal{T}_{i}\direita)+w_{b} \mathcal{L}_{BC}\left(\boldsymbol{\theta},; \mathcal{T}_{b}\right)+w_{d} \mathcal{L}_{Data}\left(\ boldsímbolo{\theta},; \mathcal{T}_{data}\right)$
onde:
$\begin{aligned} \mathcal{L}_{PDE}\left(\boldsymbol{\theta} ; \mathcal{T}_{f}\right) &=\frac{1 }{\left|\mathcal{T}_{f}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{f}}\left\|f\left(\mathbf{x } ; \frac{\parcial \hat{u}}{\parcial x_{1}}, \ldots, \frac{\parcial \hat{u}}{\parcial x_{d}} ; \frac{\parcial ^{2} \hat{u}}{\parcial x_{1} \parcial x_{1}}, \ldots, \frac{\partial^{2} \hat{u}}{\parcial x_{1} \parcial x_{d}} \right)\right\|_{2}^{2} \\ \mathcal{L}_{IC}\left(\boldsymbol{\theta};\mathcal{T}_{i}\direita) &=\frac{1}{\esquerda|\mathcal{T}_{i}\direita|} \sum_{\mathbf{x}\in \mathcal{T }_{i}}\|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_{2}^{2} \\ \mathcal{L}_{BC} \left(\ballsymbol{\theta};\mathcal{T}_{b}\right) &=\frac{1}{\left|\mathcal{T}_{b}\right|}\sum_{\ mathbf{x} \in \mathcal{T}_{b}}\|\mathcal{B}(\hat{u}, \mathbf{x})\|_{2}^{2}\\ \mathcal {L}_{Data}\left(\bold symbol{\theta}; \mathcal{T}_{data}\right) &=\frac{1}{\left|\mathcal{T}_{data} \ direita|} \sum_{\mathbf{x} \in \mathcal{T}_{dados}}\|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_ { 2}^{2} \end{alinhado}=\frac{1}{\left|\mathcal{T}_{b}\right|}\sum_{\mathbf{x}\in \mathcal{T}_{b}}\|\mathcal{B} (\hat{u}, \mathbf{x})\|_{2}^{2}\\ \mathcal{L}_{Data}\left(\bold symbol{\theta}; \mathcal{T} _ {data}\right) &=\frac{1}{\left|\mathcal{T}_{data}\right|} \sum_{\mathbf{x}\in \mathcal{T}_{data} } \|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_{2}^{2} \end{alinhado}=\frac{1}{\left|\mathcal{T}_{b}\right|}\sum_{\mathbf{x}\in \mathcal{T}_{b}}\|\mathcal{B} (\hat{u}, \mathbf{x})\|_{2}^{2}\\ \mathcal{L}_{Data}\left(\bold symbol{\theta}; \mathcal{T} _ {data}\right) &=\frac{1}{\left|\mathcal{T}_{data}\right|} \sum_{\mathbf{x}\in \mathcal{T}_{data} } \|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_{2}^{2} \end{alinhado}$
$w_{f}$ ， $w_{i}$ 、 $w_{b}$ e $w_{d}$ é o peso. $\mathcal{T}_{f}$ ， $\mathcal{T}_{i}$ 、 $\mathcal{T}_{b}$ E $\mathcal{T}_{data}$ Representa os pontos residuais do PDE, valor inicial, valor limite e valor verdadeiro. Aqui $\mathcal{T}_{f} \subconjunto \Omega$ é um conjunto predefinido de pontos para medir a saída da rede neural $\hat{u}$ Extensão da correspondência com PDE.
Finalmente, use o algoritmo de otimização de gradiente para minimizar a função de perda até que os parâmetros de rede que atendam à precisão da previsão sejam encontrados. $KaTeX parse error: Undefined control sequence: \theat at position 1: \̲t̲h̲e̲a̲t̲^{*}$ .

Vale a pena notar que para problemas inversos, ou seja, alguns parâmetros na equação são desconhecidos. Se apenas a equação PDE e as condições de contorno forem conhecidas, e os parâmetros PDE forem desconhecidos, o problema inverso é um problema indeterminado, então outras informações devem ser conhecidas, como alguns pontos de observação $o valor de vc$ . Nesse caso, o método PINN pode usar os parâmetros na equação como variáveis desconhecidas e adicioná-los ao treinador para otimização. A função de perda inclui a perda de dados.

3. Resolução da definição do problema - problema positivo

$\begin {alinhado} u_t+u u_x &=v u_{xx}, x \in[-1,1], t>0 \\ u(x, 0) &=-\sin (\pi x) \\ u( -1, t) &=u(1, t)=0 \end{alinhado}$

Onde: parâmetro $\in[0,0.1 / \pi]$ . $_$ $_$ A solução numérica é obtida pela transformação de Hopf-Cole, conforme mostra a Figura 2.
Requisitos da tarefa:

A tarefa resolve u para condições de contorno conhecidas e equações diferenciais.

Figura 2: Solução Numérica Burger

4. Exibição de resultados

Os resultados da previsão são mostrados na Figura 3-5. Além disso, vale ressaltar que o algoritmo utiliza inicialização randômica da rede, quando a inicialização não for boa, aparecerá o erro de treinamento mostrado na Figura 5.

Figura 3: Diagrama de variação dos parâmetros do problema do processo de treinamento e erro de treinamento

Os resultados da previsão durante o treinamento são mostrados na Figura 4-5.

insira a descrição da imagem aqui