论文学习——基于模式距离度量的时间序列相似性搜索

写在前面:期刊:《微计算机信息》;中文核心期刊

作者:朱天(南昌大学),硕士研究生,江西省教育厅计划项目

在这里插入图片描述

1 摘要

  1. 【本文工作】基于模式度量的,时间序列相似性搜索
  2. 该方法采用分段线性表示,改进王达提出的距离模式来度量序列间的距离。

2 引言

  • 时间序列是一类重要的复杂数据,蕴含着大量的规律性信息。
  • 时间序列的相似性搜索,是时间序列知识发现的重要问题,其主要困难在于:相似性度量的定义和算法的时间复杂度。

【啊,这,我没有觉得序列1 和序列3 的变化趋势一样啊】在这里插入图片描述

王达等人提出了 模式距离 的重要概念, 它给出了一个新颖的度量定义。能更好地反映序列间“变化趋势"的相似性。

但是它存在缺陷,由于它将模式定义为一个三元集合上升,保持,下降不能完全地刻画出时间序列的趋势变化,并且直接使用该距离度量不能解决时间轴方向上的缩放问题。

2.1 分段线性表示

  • 时间序列表示方法,很大程度上影响其距离度量对各种变形、扭曲的敏感程度,并决定相似性搜索的有效性。
  • 因此,人们都在寻找鲁棒性强、能有效地应用于时间序列模式匹配的时间序列表示方法。

分段线性表示,可以将整个时间序列截成若干子序列(不一定等长),每段用直线近似表示。

这种表示方式有以下的特点:
(1)数据压缩率高,并且保留了数据的有效信息;
(2)对噪声数据的高承受能力,分段的过程也就是去除噪声的过程;
(3)数据表示更加直观简洁。

3 改进的时间序列模式距离

猜你喜欢

转载自blog.csdn.net/weixin_42521185/article/details/125184500