Predice con precisión precipitaciones extremas, la Universidad de Columbia lanzó una versión mejorada de la red neuronal Org-NN

Contenido de un vistazo : Con la intensificación de los cambios ambientales, los fenómenos meteorológicos extremos han aparecido con frecuencia en el mundo en los últimos años. La predicción precisa de la intensidad de las precipitaciones es muy importante para los seres humanos y el medio ambiente natural. La varianza del modelo tradicional que predice la precipitación es pequeña, sesgada hacia lluvias ligeras e insuficiente para predecir precipitaciones extremas.

Palabras clave : red neuronal de aprendizaje implícito de clima extremo

Este artículo se publicó por primera vez en la plataforma pública hiperneuronal WeChat de HyperAI~

Afectada por el tifón "Du Su Rui", Beijing comenzó a experimentar fuertes lluvias durante varios días consecutivos a partir del 29 de julio, y algunas áreas sufrieron tormentas de lluvia extremadamente intensas. Las fuertes lluvias extremas provocaron grandes inundaciones en la cuenca del río Haihe, y se produjeron graves inundaciones en Mentougou, Zhuozhou y otros lugares.

Según un informe de CCTV del 31 de julio, durante las fuertes lluvias, Beijing drenó y almacenó más de 10 millones de metros cúbicos de agua, lo que equivale a vaciar el volumen de agua del lago Kunming en el Palacio de Verano, que puede predecir precipitaciones extremas en de manera oportuna, precisa y eficaz , puede minimizar las bajas y reducir las pérdidas causadas por desastres meteorológicos.

La falta de información sobre la organización y la estructura de las nubes a escala subcuadrícula en la parametrización de los modelos climáticos tradicionales afectará la intensidad y la aleatoriedad de la precipitación en una resolución de grano grueso, lo que resultará en la incapacidad de predecir con precisión la condición de precipitación extrema. Usando simulaciones de resolución de tormentas globales y aprendizaje automático, LEAP Lab de la Universidad de Columbia ha creado un nuevo algoritmo que aborda este problema de información faltante y proporciona un método de pronóstico más preciso.

Actualmente, la investigación ha sido publicada en "PNAS", el título del artículo es "El aprendizaje implícito de la organización convectiva explica la estocasticidad de la precipitación".

El artículo ha sido publicado en "PNAS"

Dirección en papel: https://www.pnas.org/doi/10.1073/pnas.2216158120#abstract

Preparativos: 10 días de datos meteorológicos + 2 redes neuronales

Datos y Procesamiento

El conjunto de datos utilizado por el equipo experimental es parte de la dinámica de circulación atmosférica simulada en la segunda fase del proyecto de comparación del Sistema de Modelos Atmosféricos (SAM) DYAMOND (Dinámica de la circulación general atmosférica modelada en dominios no hidrostáticos) . Este proyecto comparó y simuló 40 días de invierno en el hemisferio norte. Los experimentadores utilizaron los 10 días iniciales como la puesta en marcha del modelo y seleccionaron al azar 10 días de los últimos 30 días como conjunto de entrenamiento.

Los investigadores seleccionaron datos adecuados y dividieron estos datos de grano grueso (grano grueso) en subdominios, equivalentes o comparables a las cuadrículas del tamaño de GCM.

Luego, para proporcionar conjuntos de datos de capacitación, verificación y prueba, el equipo dividió 10 días en 6 días, 2 días y 2 días para capacitación, verificación y prueba, respectivamente, y solo mantuvo la precipitación por encima del umbral (0,05 mm/ h) para centrarse únicamente en la intensidad de la precipitación y no en el desencadenante de la precipitación . Finalmente, el número total de muestras es de 108.

arquitectura de redes neuronales

En el experimento, los investigadores utilizaron dos redes neuronales: el modelo tradicional Baseline-NN (red neuronal de línea base) y el recientemente propuesto Org-NN .

Baseline-NN es una red de alimentación directa totalmente conectada (red de alimentación directa totalmente conectada), la tasa de aprendizaje se ajusta por generación. Como modelo tradicional, Baseline-NN solo puede acceder a variables a gran escala y predecir la precipitación.

Org-NN contiene un codificador automático cuya parte del codificador consta de tres capas convolucionales 1D y dos capas completamente conectadas . La entrada del codificador es una anomalía PW (agua precipitable) de alta resolución con un tamaño de 32 x 32, y la salida es la variable org. La dimensión org es un hiperparámetro de la red, que los investigadores establecieron en 4. El decodificador recibe la variable org y reconstruye el campo original de alta resolución, justo lo contrario de la estructura del codificador. La parte de la red neuronal de Org-NN es similar a Baseline-NN, solo se agrega la variable latente de la organización (org) como su entrada .

Ambos se implementaron con TensorFlow versión 2.9 y los hiperparámetros se ajustaron con la biblioteca de optimización Sherpa.

Resultados experimentales

El equipo experimental entrenó previamente a dos modelos. Para evaluar el desempeño predictivo de las redes neuronales, los investigadores eligieron R2, una métrica comúnmente utilizada para cuantificar el desempeño de los modelos de regresión . Calculado de la siguiente manera:

inserte la descripción de la imagen aquí

Modelo tradicional Baseline-NN

El equipo experimental primero usa Baseline-NN. La siguiente figura muestra la previsibilidad de la precipitación cuando se utilizan PW, SST, qv2m y T2m de grano grueso como datos de entrada . Entre ellos, qv2m y T2m se utilizan para proporcionar información sobre las condiciones de la capa límite a Baseline-NN. El equipo experimental agrupó el PW de grano grueso, promedió los valores pronosticados y reales de la precipitación de grano grueso dentro de cada grupo y calculó la varianza de la precipitación de grano grueso dentro de cada grupo .

PW : Agua precipitable
SST : Temperatura de la superficie del mar, temperatura de la superficie del mar
qv2m : Humedad específica a 2 m cerca de la superficie, humedad específica cerca de la superficie
T2m : Humedad del aire a 2 m cerca de la superficie, temperatura de la superficie

inserte la descripción de la imagen aquí

Figura 1: Promedios de precipitación de grano grueso sobre el contenedor PW

Línea discontinua : media de precipitación real
Línea naranja : media de precipitación pronosticada
Línea verde : R2 calculado en cada intervalo de PW
Sombreado : varianza dentro de cada intervalo

Baseline-NN recupera con precisión el comportamiento clave de la media de precipitación (es decir, la media agrupada) en condiciones de PW, así como la transición rápida que ocurre cerca del punto crítico. Sin embargo, el equipo experimental descubrió que no podía tener en cuenta la variabilidad de la precipitación observada en las simulaciones de tormentas globales y que su rendimiento (medido por el valor R2 en todas las muestras) era de alrededor de 0,45. Un valor bajo de R2 indica que, aunque se puede capturar cierta variabilidad en la precipitación, no se puede encontrar una relación fuerte entre la entrada y la precipitación , y el valor R2 calculado para cada intervalo de PW no supera 0,5.

Al mismo tiempo, el equipo experimental también comparó la función de densidad de probabilidad de la precipitación predicha por Baseline-NN con la precipitación real, lo que demuestra que el modelo no puede predecir la cola de la distribución de la precipitación, es decir, no puede predecir la precipitación extrema .

inserte la descripción de la imagen aquí

Figura 2: Diagrama esquemático de la función de densidad de probabilidad de la precipitación

Parte azul : función de densidad de probabilidad de la precipitación real
Parte naranja : función de densidad de probabilidad de la precipitación según la predicción

Los investigadores también utilizaron la cobertura total de nubes en un nivel de grano grueso como una de las entradas de la red neuronal para probar más a fondo el Baseline-NN . La cobertura total de nubes es una variable parametrizada en los modelos climáticos y no tiene una relación directa con la precipitación, por lo que usarla como entrada para una red neuronal podría proporcionar pistas sobre la condensación, que se usa directamente en la parametrización de la precipitación. Esto hace poco para mejorar los pronósticos, pero destaca que la cobertura nubosa media no brinda información relevante para pronósticos de precipitación precisos. Además, a través de un análisis más detallado, el equipo experimental confirmó que CAPE y CIN no se pueden usar como predictores y no pueden mejorar los resultados de predicción .

inserte la descripción de la imagen aquí

Figura 3: Gráfica de función de densidad de probabilidad de precipitación

Parte azul : función de densidad de probabilidad de precipitación real
Parte naranja : función de densidad de probabilidad de precipitación prevista
a : la entrada es [PW, SST, qv2m, T2m, flujo de calor sensible, flujo de calor latente)] b: la
entrada es [PW, SST, qv2m, T2m , cantidad total de nubes]
c : la entrada es [PW, SST, qv2m, T2m, CAPE, CIN]

La conclusión es que Baseline-NN es menos capaz de predecir con precisión la precipitación y la variabilidad .

Nuevo modelo Org-NN

A continuación, el equipo experimental subvirtió el método tradicional, que consiste en utilizar Org-NN para la predicción. Debido a que Org-NN contiene un codificador automático, puede recibir retroalimentación directamente de la función objetivo de la red neuronal a través de la retropropagación. Por lo tanto, el autocodificador podrá extraer de forma pasiva información relevante para mejorar la predicción de la precipitación .

La siguiente figura muestra los resultados de predicción de precipitación de Org-NN con variables de grano grueso y org como entrada. En comparación con Baseline-NN, la mejora de Org-NN es significativa . Cuando se calcula en todos los puntos de datos, el R2 pronosticado aumenta a 0,9. Para cada intervalo de PW, a excepción del intervalo de menor precipitación, los valores de R2 calculados son casi cercanos a 0,80.

inserte la descripción de la imagen aquí

Figura 5: Gráfico de resultados de predicción de Org-NN

D : valor medio de precipitación de grano grueso en el contenedor PW
E : diagrama esquemático de la función de densidad de probabilidad de precipitación
F : valor R2 calculado en cada posición de latitud y longitud en la figura D en el paso de tiempo. El área blanca en el gráfico indica una precipitación inferior a 0,05 mm/h, que se excluyó como entrada del modelo. El valor R2 de Org-NN es significativamente superior a 0,8 en la mayoría de las zonas, excepto en las proximidades de los puntos donde no se alcanza el umbral de precipitación.

El equipo experimental cuantificó aún más el rendimiento de Org-NN comparando la función de densidad de probabilidad de precipitación real entre Org-NN y el modelo de precipitación de alta resolución. Se encontró que Org-NN capturó completamente la función de densidad de probabilidad, incluida la cola de su distribución, que corresponde a la precipitación extrema. Esto demuestra que Org-NN puede predecir con precisión la situación de precipitación extrema .

Los resultados obtenidos por el equipo experimental muestran que al incorporar org como entrada, la predicción de precipitaciones mejora significativamente. Esto sugiere que la estructura a escala secundaria puede ser una pieza importante de información que falta en la parametrización de la convección y la precipitación en los modelos climáticos actuales .

Resumen del proceso experimental

inserte la descripción de la imagen aquí

Figura 6: Resumen del proceso experimental

A : Proceso de procesamiento de datos: Datos de alta resolución de grano grueso
B : Línea base-NN: La red recibe variables de escala gruesa (como SST y PW) como entrada y predice precipitación de escala gruesa.
C : Org-NN: La figura de la izquierda muestra el codificador automático, que recibe PW de alta resolución como entrada y lo reconstruye después de pasar por el cuello de botella. La imagen de la derecha muestra una red neuronal que predice la precipitación a gran escala.

Un cambio en los modelos climáticos tradicionales es inminente

El equipo de este experimento proviene de Learning the Earth with Artificial Intelligence and Physics (LEAP) , un centro de ciencia y tecnología de la NSF lanzado por la Universidad de Columbia en 2021. Su principal estrategia de investigación es combinar el modelado físico y el aprendizaje automático, utilizando la ciencia del clima. en el modelado climático combinado con algoritmos de aprendizaje automático de última generación para mejorar las predicciones climáticas a corto plazo . Esto es beneficioso para el desarrollo tanto de la ciencia climática como de la ciencia de datos.

inserte la descripción de la imagen aquí

Perfiles de algunos miembros del LEAP Lab

|Sitio web oficial del laboratorio: https://leap.columbia.edu

Los investigadores ahora están aplicando su enfoque de aprendizaje automático a los modelos climáticos para mejorar las predicciones de la intensidad y la variabilidad de las precipitaciones y permitir a los científicos predecir con mayor precisión los cambios en el ciclo del agua y los patrones climáticos extremos en el contexto del calentamiento global .

Al mismo tiempo, este estudio también abre nuevas direcciones de investigación, como explorar la posibilidad de que la precipitación tenga un efecto de memoria, por el cual la atmósfera retiene información sobre las condiciones climáticas recientes, lo que a su vez afecta las condiciones atmosféricas posteriores. El nuevo método puede tener una amplia gama de aplicaciones más allá de las simulaciones de precipitaciones, como mejores simulaciones de capas de hielo y superficies oceánicas.

Este artículo se publicó por primera vez en la plataforma pública hiperneuronal WeChat de HyperAI~

Supongo que te gusta

Origin blog.csdn.net/HyperAI/article/details/132164702
Recomendado
Clasificación