A continuación, presentaré la red neuronal de conocimiento de física integrada (PINN) para resolver ecuaciones diferenciales. En primer lugar, se introduce el método básico de PINN y, basándose en el marco de solución de PINN de Pytorch, se resuelve el problema inverso de la ecuación de Burger unidimensional con término de tiempo.

Red neuronal integrada de conocimiento físico (PINN) Introducción y artículos relacionados
Aprendizaje profundo para resolver ecuaciones diferenciales Serie 1: Marco de solución de PINN (Poisson 1d)
Aprendizaje profundo para resolver ecuaciones diferenciales Serie 2: PINN para resolver problemas de reenvío de ecuaciones de hamburguesa
Aprendizaje profundo para resolver ecuaciones diferenciales Serie 3: PINN resuelve el problema inverso de la ecuación de Burger
Aprendizaje profundo para resolver la ecuación diferencial Serie cuatro: Basado en la función de activación adaptativa PINN resuelve el problema inverso de la ecuación de Burger

1. Introducción a PINN

Como una poderosa herramienta de procesamiento de información, la red neuronal se ha utilizado ampliamente en los campos de la visión por computadora, la biomedicina y la ingeniería de petróleo y gas, lo que ha desencadenado cambios tecnológicos en muchos campos. La red de aprendizaje profundo tiene una capacidad de aprendizaje muy fuerte, no solo puede descubrir leyes físicas, sino también resolver ecuaciones diferenciales parciales. En los últimos años, la solución de ecuaciones diferenciales parciales basadas en el aprendizaje profundo se ha convertido en un nuevo foco de investigación. La red neuronal informada por la física integrada (PINN) es una aplicación de máquinas científicas en el dominio numérico tradicional, que se puede utilizar para resolver varios problemas relacionados con ecuaciones diferenciales parciales (PDE), incluida la resolución de ecuaciones, inversión de parámetros, descubrimiento de modelos, control y optimizacion etc

2. Método PINN

La idea principal de PINN se muestra en la Figura 1, primero construya un resultado de salida como $\hat{u}$ La red neuronal de ^, que se usa como un modelo proxy para la solución PDE, y la información PDE se usa como una restricción, codificada en la función de pérdida de la red neuronal para el entrenamiento $.$ La función de pérdida incluye principalmente cuatro partes: pérdida de estructura diferencial parcial (pérdida PDE), pérdida de condición de valor límite (pérdida BC), pérdida de condición de valor inicial (pérdida IC) y pérdida de condición de datos reales (pérdida de datos).
inserte la descripción de la imagen aquí

Figura 1: Diagrama esquemático de PINN

En particular, considere el siguiente problema PDE, donde la solución de la PDE $u (x)$ 在 $\Omega \subset \mathbb{R}^{d}$ definición, donde $\mathbf{x}=\left(x_{1}, \ldots, x_{d}\right)$ ：
$f\left( \mathbf{x} ; \frac{\parcial u}{\parcial x_{1}}, \ldots, \frac{\parcial u}{\parcial x_{d}} ; \frac{\parcial^{2} u}{\parcial x_{1} \parcial x_{1}}, \ldots, \frac{\parcial^{2} u}{\parcial x_{1} \parcial x_{d}} \right)=0 , \quad \mathbf{x} \in \Omega$
Al mismo tiempo, satisfaga el siguiente límite
$\mathcal{B}(u, \mathbf{x})=0 \quad \text { on } \quad \partial \Omega$

El proceso de solución de PINN incluye principalmente:

El primer paso es definir el modelo de red neuronal de la capa totalmente conectada de la capa D:
$N_{\Theta}:=L_D \circ \ sigma \circ L_{D-1} \circ \sigma \circ \cdots \circ \sigma \circ L_1$
式中：
$\begin{alineado} L_1(x) &:=W_1 x+b_1, \quad W_1 \in \mathbb{R}^{d_1 \times d}, b_1 \in \mathbb{R}^{d_1} \\ L_i (x) &:=W_i x+b_i, \quad W_i \in \mathbb{R}^{d_i \times d_{i-1}}, b_i \in \mathbb{R}^{d_i}, \forall i =2,3, \cdots D-1, \\ L_D(x) &:=W_D x+b_D, \quad W_D \in \mathbb{R}^{N \times d_{D-1}}, b_D \ en \mathbb{R}^N . \end{alineado}$
y $\sigma$ es la función de activación, $W$ y $b$ son los parámetros de peso y sesgo.
El segundo paso, para medir la red neuronal $\hat{u}$ 和约束之间的差异，考虑损失函数定义：
$\mathcal{L}\left(\boldsymbol{\theta}\right)=w_{f} \mathcal{L}_{PDE}\left(\boldsymbol{\theta}; \mathcal{ T}_{f}\right)+w_{i} \mathcal{L}_{IC}\left(\boldsymbol{\theta} ; \mathcal{T}_{i}\right)+w_{b} \mathcal{L}_{BC}\left(\boldsymbol{\theta},; \mathcal{T}_{b}\right)+w_{d} \mathcal{L}_{Datos}\left(\ boldsymbol{\theta},; \mathcal{T}_{datos}\right)$
donde:
$\begin{alineado} \mathcal{L}_{PDE}\left(\boldsymbol{\theta} ; \mathcal{T}_{f}\right) &=\frac{1 }{\left|\mathcal{T}_{f}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{f}}\left\|f\left(\mathbf{x } ; \frac{\parcial \hat{u}}{\parcial x_{1}}, \ldots, \frac{\parcial \hat{u}}{\parcial x_{d}} ; \frac{\parcial ^{2} \hat{u}}{\parcial x_{1} \parcial x_{1}}, \ldots, \frac{\parcial^{2} \hat{u}}{\parcial x_{1} \partial x_{d}} \right)\right\|_{2}^{2} \\ \mathcal{L}_{IC}\left(\boldsymbol{\theta};\mathcal{T}_{i}\right) &=\frac{1}{\left|\mathcal{T}_{i}\right|} \sum_{\mathbf{x}\in \mathcal{T }_{i}}\|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_{2}^{2} \\ \mathcal{L}_{BC} \left(\ballsymbol{\theta};\mathcal{T}_{b}\right) &=\frac{1}{\left|\mathcal{T}_{b}\right|}\sum_{\ mathbf{x} \in \mathcal{T}_{b}}\|\mathcal{B}(\hat{u}, \mathbf{x})\|_{2}^{2}\\ \mathcal {L}_{Datos}\left(\símbolo en negrita{\theta}; \mathcal{T}_{datos}\right) &=\frac{1}{\left|\mathcal{T}_{datos} \ right|} \sum_{\mathbf{x} \in \mathcal{T}_{datos}}\|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_ { 2}^{2} \end{alineado}=\frac{1}{\left|\mathcal{T}_{b}\right|}\sum_{\mathbf{x}\in \mathcal{T}_{b}}\|\mathcal{B} (\hat{u}, \mathbf{x})\|_{2}^{2}\\ \mathcal{L}_{Data}\left(\negrita{\theta}; \mathcal{T} _ {datos}\right) &=\frac{1}{\left|\mathcal{T}_{datos}\right|} \sum_{\mathbf{x}\in \mathcal{T}_{datos} } \|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_{2}^{2} \end{alineado}=\frac{1}{\left|\mathcal{T}_{b}\right|}\sum_{\mathbf{x}\in \mathcal{T}_{b}}\|\mathcal{B} (\hat{u}, \mathbf{x})\|_{2}^{2}\\ \mathcal{L}_{Data}\left(\negrita{\theta}; \mathcal{T} _ {datos}\right) &=\frac{1}{\left|\mathcal{T}_{datos}\right|} \sum_{\mathbf{x}\in \mathcal{T}_{datos} } \|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_{2}^{2} \end{alineado}$
$w_{f}$ ， $w_{i}$ 、 $w_ {b}$ y $w_{d}$ es el peso $\mathcal{T}_{f}$ ， $\mathcal{T}_{i}$ 、 $\mathcal{T}_{b}$ 和 $\mathcal{T}_{data}$ Representa puntos residuales de PDE, valor inicial, valor límite y valor verdadero. Aquí $\mathcal{T}_{f} \subset \Omega$ es un conjunto predefinido de puntos para medir la salida de la red neuronal $\hat{u}$ Grado de coincidencia con PDE.
$Finalmente, use el algoritmo de optimización de gradiente para minimizar la función de pérdida hasta que se encuentren los parámetros de$ red que cumplan con la precisión de la predicción .

Vale la pena señalar que para problemas inversos, es decir, algunos parámetros en la ecuación son desconocidos. Si solo se conocen la ecuación PDE y las condiciones de contorno, y se desconocen los parámetros PDE, el problema inverso es un problema indeterminado, por lo que se debe conocer otra información, como algunos puntos de observación $el valor de ud$ . En este caso, el método PINN puede utilizar los parámetros de la ecuación como variables desconocidas y agregarlos al entrenador para su optimización.La función de pérdida incluye la pérdida de datos.

3. Definición de problema de resolución - problema inverso

$\begin {alineado} u_t+u u_x &=v u_{xx}, x \in[-1,1], t>0 \\ u(x, 0) &=-\sin (\pi x) \\ u( -1, t) &=u(1, t)=0 \end{alineado}$

En la fórmula: parámetro $v$ es un parámetro desconocido, el valor real es $\in[0,0.1 / \pi]$ _ La solución numérica se obtiene por transformación de Hopf-Cole, como se muestra en la Figura 2.
Requisitos de la tarea:

La tarea es conocer las condiciones de contorno y las ecuaciones diferenciales, pero los parámetros en las ecuaciones son desconocidos, y resolver u y los parámetros de la ecuación.
Este problema es un problema inverso típico, un problema de inversión de optimización de los parámetros de la ecuación.

Figura 2: Solución numérica de hamburguesa

4. Visualización de resultados

El proceso de entrenamiento y el diagrama de cambio de parámetros se muestran en la Figura 3. Se puede ver claramente que en la etapa inicial del entrenamiento, el PINN que usa la función de activación adaptativa puede descender más rápido y converger al valor exacto.

inserte la descripción de la imagen aquí

Figura 3: Diagrama de variación de los parámetros del problema del proceso de entrenamiento y error de entrenamiento

Los resultados de la predicción durante el entrenamiento se muestran en la Figura 4-6.

inserte la descripción de la imagen aquí

Figura 4: Gráfico de error de predicción

inserte la descripción de la imagen aquí

Figura 5: gráfico de predicción

inserte la descripción de la imagen aquí

Figura 6: Pronóstico de resultados en diferentes momentos

PINN Aprendizaje profundo para resolver ecuaciones diferenciales Serie tres: Resolviendo el problema inverso de la ecuación de la hamburguesa

1. Introducción a PINN

2. Método PINN

3. Definición de problema de resolución - problema inverso

4. Visualización de resultados

Supongo que te gusta