论文学习——基于优化DTW算法的水文要素时间序列数据相似性分析

写在前面:《水文》(JOURNAL OF CHINA HYDROLOGY);双月刊;中文核心;主办单位:水利部水文局;水利部水利信息中心

1 摘要

  1. 针对的问题:基于水文要素摘录数据的相似性分析的优点和存在的问题;
  2. 提出的论点:使用DTW解决水文要素摘录数据时序间距不一致、时长不一致的问题;
  3. 创新点:根据水文时间序列数据周期性起伏变化频繁的特征,基于最长公共子串,对DTW算法进行优化改进,从而提高相似性匹配精度;
  4. 论证过程:首先引入基于水文要素摘录的数据的相似性的分析存在问题,主要在于引入DTW会导致水文数据时序间距不一致的问题;然后根据水文序列周期性,基于最长公共子串,对DTW进行改进,从而提高相似性的匹配精度。

2 结论

  1. 水文时间序偶咧数据的相似性挖掘,在水文研究领域具有重要意义,尤其是对供水预报、防洪调度等方面的支撑作用。
  2. 两种:①基于日平均水文要素时间序列数据; ②基于水文要素摘录时间序列数据
  3. 作者认为,基于水文要素摘录数据,进而进行水文过程相似性分析,更能反映水文过程;
  4. 通过基于最长公共子串匹配,对DTW算法进行优化,旨在解决周期性频繁起伏变化水文时间序列数据, 在距离计算中的“病态匹配”问题

3 引言

这一段引言写的蛮好的。
在这里插入图片描述

  • 在防汛抗旱指挥和预报分析中,经常需要知道相似的水文过程,以便做出相应的防汛抗旱决策,就需要对水文降雨、水位、流量(降雨量)等过程线进行相似性分析,查找相似的水文过程

4 水文时间序列数据相似性度量的相关研究

  • 水文时间序列数据:[时刻,水文要素检测值],按照观测时刻排列的水文数据的有序集合。
  • 水文时间序列数据相似性,就是比较基于水文监测数据绘成水文过程曲线的相似程度。

大量研究、分析方法:
(1)两个时间序列的欧氏距离
(2)李薇等,通过引入数据仓库和数据挖掘的理论和技术,对两个站口的日平均降雨量相似性查询;[1]
(3)朱跃龙等,以太湖流域某站日平均水位数据为例,提出基于语义相似的水文时间序列相似性挖掘;[2]
(4)杨艳林等,提出基于DTW聚类的水文时间序列相似性挖掘方法 ;[3]

在这里插入图片描述

4.1 提出问题

  • 一般日平均水文数据(文中用的最多的就是水文站的日平均水位),不能代表该水文要素的实际变化过程,而水文要素摘录数据可以完整的反应水文要素的实际变化过程。
  • 但是,水文要素摘录数据的时间间距不一致,序列数据时间点也不是一一对应的。

在这里插入图片描述
图1 是日平均水文数据,因为水位数据是每隔1h记录一次的,那么日平均水位数据就是24h的水位求和除以24;
图2是水文要素摘录过程线,这两条线的序列数据时间点不是一一对应的,2018年摘录了1278个数据,1997年摘录了891个数据,时间间距也是不一样的,有1h,2h,4h等等。【很显然,下面一种数据表示方法,能够看出这两条曲线是存在相似性的,2018年的数据“在时间步长上缩减、扭曲一下”, 就可以和1997年的时间序列数据存在很大的相似性!而这一种想法,我们称之为“语义相似”, 更多解释可以学习一下DTW】

4.2 DTW动态时间弯曲距离算法

  • 对时间序列数据进行规整(延伸、缩短),使得两个序列的时刻尽可能一致。
  • 最早用于语音识别领域
  • 弥补欧式距离的缺点:只能计算时间间距一致、数据点数据一致的缺陷,【也就是说,时间序列不一样长,也是可以进行比较的了】

5 基于DTW的水文要素时间序列数据相似性度量方法

5.1 介绍DTW

一般使用欧式距离公式,构建序列X和序列Y的距离矩阵D。
在这里插入图片描述
在这里插入图片描述

5.2 数据介绍(实验要做什么)

  1. 选取长江干流汉口,武汉关水文站的水位数据。
    【这里我bb一句,前面说的很高大上的“水位要素”,讲白了在文章中就是水位数据,也就是记录某时某刻的水位是多少mm】
  2. 水位数据(1865年-2017年),以2018年为基准,查找1865年-2017年中,哪一年与2018年水位变化情况最相似
  3. 也就是说,“分析当前水位过程与历史上哪一时期的过程是类似的”,就是要以“年”为单位,查找相似水位变化、

5.3 创新点:基于最长公共子串的DTW算法优化

  1. 发现水文时间序列数据具有周期性起伏变化的特征
  2. 基于水文时间序列数据具有周期性起伏变化频繁的特征,两个数值序列的最长公共子串的长度对相似度的影响很大,即两个数值序列的最长公共子串越长,偏差越小,需要调整的幅度越小

5.4 算法流程

在这里插入图片描述

5.5 输出结果分析

  1. 输出的是相似度最高的3个年份

在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_42521185/article/details/124989573