论文学习——基于极值点特征的时间序列相似性查询方法

写在前面:《计算机应用研究》;
作者:吴学雁、黄道平(华南理工大学)

在这里插入图片描述

1 摘要

  1. 研究的是:时间序列子序列匹配问题
  2. 首先识别出序列中的极值点,然后根据极值点 使用多层次极值划分法对长序列进行划分。
  3. 然后对划分得到的多层次子序列集 使用改进的动态时间弯曲方法与查询序列进行相似性匹配。
  4. 最后找到与查询序列最相似的子序列。

2 引言

  1. 时间序列存在各种复杂变形(如平移、伸缩、间断等),且变形时间和变形程度均无法预料,而广泛采用欧式距离及其变体 对时间轴的变形非常敏感,一些轻微的改变就会导致欧式距离发生很大变化。

  2. 在时间序列数据中,尤其是水文时间序列,最值得关注的往往是序列中的一些特征点。

  3. 本文提出一种提取重要极值点的方法,依据重要极值点对时间序列进行分段表示;然后在此基础上使用一种改进的DTW方法进行相似性度量。

3 研究现状

3.1 全序列匹配和子序列匹配

时间序列相似性查询分为全序列匹配子序列匹配两种方式。在全序列匹配中,查询序列与被查询序列的长度相同;在子序列匹配中,查询序列Q和查询序列P 被给定,任务是在序列P中寻找与序列Q相匹配的子序列。
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

3.2 三种子序列匹配分段方式

在这里插入图片描述

3.3 相似性度量函数的选取

  • 欧式距离对于时间轴的变化非常敏感
  • 大量文献都是在DTW的基础上进行改进,并且大部分改进都是在使用DTW算法之间,加入预先的筛选剪枝过程。
    在这里插入图片描述

4 本文重点——多层级极值划分方法

在这里插入图片描述

4.1 重要性标志算法(EIIR)

  • cyc是用户定义的参数,表示极值的计算邻域范围。如果cyc=3,则表示在序列点前后三个点的范围内进行计算。
  • cyc范围内判断重要极值点。

4.2 极值点判断算法(JEP)

在这里插入图片描述

4.3 多层次分段获取算法(MSR)

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_42521185/article/details/125584153