章硕士论文学习——第二章数据挖掘中的聚类方法+时间序列相似性分析

1 前言

  1. 时间序列相似性度量,是高效时间序列相似比较分析的基础,建立何种度量函数来实现时间序列相似度量直观重要
    —— 度量函数的选择!!!

  2. 考虑各种度量函数的特性,以及具体应用领域的实际需求。

2 总结距离度量函数

  1. Minkowski距离,和对其具象化的欧氏距离, 及曼哈顿距离
  2. 动态时间弯曲距离(DTW)
  3. 基于最长公共子序列的距离(LCS)
  4. 编辑距离(ED)
  5. 模式距离(PD)
  6. 斜率距离(SD)
  7. 界标距离

2.1 动态时间弯曲距离 DTW

  1. DTW在语音识别领域得到了广泛应用
  2. 与Minkowski距离不同,DTW不要求两条时间序列长度相同
  3. 无需将序列之间的数据点一一对应,而是寻找与序列点最近的点进行匹配,根据最小代价的时间弯曲路径进行对齐匹配

2.2 最长公共子序列距离 LCS

  1. 利用两个时间序列中,相同的最长子串的长度,与时间序列长度的比值,来度量这两条时间序列的相似性。
  2. 有一定的应用范围,但是不支持时间轴伸缩。
  3. 值得注意的是,LCS在处理时间序列的不连续性时要比Minkowski距离和DTW距离更准确。

2.3 **模式距离 PD

  1. 弥补了点距离的很多缺陷:如不支持时间弯曲、平移等等
  2. 模式距离 PD 可以更科学合理的体现时间序列的动态性和变化的趋势。
  3. 在时间序列的模式表示中,通常用三元集合{ 上升, 保持 , 下降} 来表示变换趋势
  4. 可以更直观地反映时间序列的趋势,它主要用来度量具有相同长度的两个时间序列之间的相似性的差异程度。

猜你喜欢

转载自blog.csdn.net/weixin_42521185/article/details/125078566
今日推荐