【论文阅读】Geographically and temporally weighted neural networks for ground-level PM2.5

Abstract:

气溶胶光学厚度AOD数据(aerosol optical depth)和地面观测站数据构成了对PM2.5的可靠量测,一般的 AOD-PM2.5关系都是使用线性模型进行模拟的。使用深度学习的方法可以模拟非线性关系,但是没有考虑空间因素。本实验使用中国地区的satellite AOD products、NDVI data 、meteorological factors 和station PM2.5 measurements 作为输入数据,得到非地面观测站区域的数据(也许从某种意义上说算是一种插值方法),并在此基础上得到分辨率为0.1°的PM2.5 区域数据

Introduction

 global modeling和spatio-temporal modeling是两种对PM2.5的描述方法。global modeling(LR, MLR, SEM, machine learning models)不随时间和地点变化,在所有研究区域都使用相同的系数;spatiotemporal modeling使用随时间和空间变化的系数,考虑到了AOD-PM2.5之间关系的时空动态性。本文的目标是在机器学习中综合时空异质性建立时空动态的AOD-PM2.5非线性模型

也就是建立geographically and temporally weighted neural networks (GTWNNs)

 Study region and data

站点数据:中国地区2015年全年的小时级PM2.5数据进行逐日平均

卫星数据:MODIS C6 Terra 和 Aqua AOD的 AOD_550_Dark_Target_Deep_Blue_Combined_Mean_Mean产品,10km分辨率(AOD产品详情),两种AOD产品直接取值或者求平均。此外NDVI用以反映土地利用情况

气象数据:NASA的重分析数据MERRA-2,空间分辨率为0.625° longitude × 0.5° latitude,变量包括 wind speed、air temperature、relative humidity、surface pressure 以及 planetary boundary layer height

数据预处理和匹配:目的是获取时间和空间一致的数据集。

1、统一投影到同一个坐标系  2、线性方法重采样到 0.1 degree  3、提取地面站点所在位置的卫星和气象数据

 GTWGRNN model

模型结构的数学表示如下:

其中代表在格网 j 的PM2.5预测值,即位置以及年天数 j 。为以地面PM2.5作为输入的时空函数,使用的是generalized regression neural network (GRNN)模型

分成三层:

1、输入层:satellite AOD, RH, WS, TMP, PS, PBL 以及NDVI等

2、隐藏层:其神经元数量与构建GRNN模型的样本数量相同

3、汇总层:only one node

样本选择(地理和时间权重)

为了体现时空差异性,引入了地理和时间权重的概念,具体体现在

① 使用第 T 天以及之前天数的数据

② 使用 Gaussian distance decay-based weighting function 来衡量在时空维度 k 样本对 prediction grid cell j 的重要性,即

 ds 和 dt 是 k 对 prediction grid cell j 的时空距离;

λ 平衡时空作用;λ = 0 时表示时间距离不产生影响,λ = ∞ 时表示只有时间产生影响;

hst 表示 k 样本对 prediction grid cell j 的衰减带宽

目前,在构建时只考虑权值大于 1E-6的样本点

参数选择

cross-validation technique 来选择 λ 和 hst 的值。

还涉及到固定带宽(最邻近点数发生变化)还是可变带宽(最邻近点数不发生变化)的问题,本研究使用的是adaptive bandwidth

Model evaluation

常用的方法是10 fold cross-validation technique,又可以分成sample-based和site-based两种,其划分方式不太相同

① sample-based cross-validation:samples were divided into 10 folds 

效果:reflect the overall predictive ability

② site-based cross-validation:the grid cells containing monitoring sites  ( the “site” here refers to “grid cell”)

效果: the spatial prediction performance more reasonably.

结果

猜你喜欢

转载自blog.csdn.net/weiwanshu/article/details/87968195