【论文泛读03】卷积LSTM网络:一种短时降雨量预测的机器学习方法

贴一下汇总贴:论文阅读记录

论文链接:《Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting》

一、摘要

短时降雨量预报的目的是预测局部地区在较短时间内的未来降雨强度。以前很少有研究从机器学习的角度来研究这一至关重要且具有挑战性的天气预报问题。在本文中,我们将短时降雨量预报定义为一个输入和预报目标都是时空序列的预测问题。通过扩展全连接LSTM (FC-LSTM),使其在输入到状态和状态到状态的转换中都具有卷积结构,我们提出了卷积LSTM (ConvLSTM),并利用它建立了短时降雨量预报问题的端到端的可训练模型。实验表明,我们的ConvLSTM网络能够更好地捕捉到短时降雨量预报的时空相关性,并始终优于FC-LSTM和最先进的operational ROVER算法。

文章主要内容

目标是在相对较短的时间,内准确和及时地预测局部地区的降雨强度,即利用以前观测到的雷达回波序列预测局部区域未来固定长度的雷达图。

短时降水预报实质上是一个以过去雷达图序列为输入,以未来雷达图的一个固定数字序列为输出的时空序列预报问题。

提出了一种用于降水临近预报的卷积 LSTM (ConvLSTM)网络。我们将降水临近预报问题定义为一个时空序列预测问题,为了更好地模拟时空关系,我们将FC-LSTM 的思想推广到卷积结构的 ConvLSTM,它在输入到状态和状态到状态的转换中都具有卷积结构。通过叠加多个 ConvLSTM 层,形成一个编码预测结构,建立短时降水预报模型。为了进行评估,创建了一个新的现实生活中的雷达回波数据集。

二、结论

将短时降雨量预报定义为一个时空序列预报问题,并提出了一种新的LSTM扩展方法ConvLSTM来解决这一问题。ConvLSTM层不仅保留了FC-LSTM的优点,而且由于其固有的卷积结构,也适用于时空数据。将ConvLSTM整合到编码预报结构中,建立了一个端到端可训练的短时降雨量预报模型。

可能的研究方向:

  • 研究如何将ConvLSTM应用于基于视频的动作识别。
  • 在卷积神经网络生成的空间特征映射上添加ConvLSTM,并使用ConvLSTM的隐藏状态进行最终分类。

三、现有的短时降雨量预报方法

  • 基于NWP的方法
    在临近预报的时间尺度上进行预报需要对大气模式中的物理方程进行复杂而细致的模拟。
  • 基于雷达回波外推的方法
    雷达地图通常每6-10分钟从天气雷达获取一次,而临近预报则在接下来的1-6小时内完成,即预测未来6-60帧(时空序列预测问题)。

四、LSTM的相关拓展

  • 基于序列模型的长短期记忆(Long Short-Term Memory for Sequence Modeling)

所谓序列模型, 即输入依赖于时间信息的模型。HMM、CRF

  • FC-LSTM

可以看作是LSTM的多元版本,其中输入、单元输出和状态都是一维向量。

  • 卷积LSTM(Convolutional LSTM)

FC-LSTM在处理时空数据方面的主要缺点是在输入到状态和状态到状态的转换中使用了完全连接,其中没有对空间信息进行编码。

猜你喜欢

转载自blog.csdn.net/qq_41485273/article/details/113686248