论文学习——分段时间序列相似性研究与应用

企业开发 2022-06-02 14:40:26 阅读次数: 0

文章目录

1 时间序列挖掘 (TSDM, Time Series Data Mining)
2 数据挖掘中的聚类方法及时间序列相似性分析
- 2.1 聚类的定义
- 2.2 K-means的局限性

写在前面：这是一篇硕士论文。我的idea被导师毙掉了，现在我又开始从头搭建我的碉堡…

在这里插入图片描述

1 时间序列挖掘 (TSDM, Time Series Data Mining)

定义：基于一个或多个时间序列的数据挖掘，它的任务是从时间序列中提取相关规律，分析其数值周期，以及对其进行预测等。
【先一个序列，然后再多个序列】
基本所有时间序列数据挖掘方法都要涉及到相似性分析，例如时间序列的分类、聚类、相似性搜索、分段、异常检测和主题发现。
水文时间序列数据挖掘目前主要的研究方向，集中于分类预测、相似性度量和模式发现等等。

1.1 研究时间序列相似性度量方式

一元时间序列度量方式：

基于 Euclidean 距离
基于 DTW 距离
基于斜率距离
基于模式距离

多元时间序列的相似性度量方式：
5. 基于 BORDA计数法的度量
6. 基于主成分分析（PCA）的度量
7. 改进PCA度量方式的相似性度量
8. 结合PCA及隐马尔科夫模型的度量
9. 基于点分布特征的度量

在这里插入图片描述

1.2 研究时间序列分段表示方式

线性分段表示PLR —— 首先选取分段点，分段点一般是极值点、关键点、重要点，然后将分段点直接首尾相连。
基于PAA的分段线性表示算法 —— 用等宽度窗口分割时间序列，每个窗口内的时间序列用序列均值来表示。FPAA克服了窗口必须等长的缺陷，并且支持时间序列在线划分。

1.3 降雨时间序列数据集

降雨的水文过程本身是不连续的，是一种离散、分段时间序列，本文提出的降雨站点时间序列的特征量，是基于单场降雨的统计量，因为实际上单场降雨能放映出降雨时间序列更丰富的信息。
在2012年是缺乏对单场降雨序列之间相似性内容的研究的

2 数据挖掘中的聚类方法及时间序列相似性分析

聚类分析和时间序列相似性分析是数据挖掘中两个非常有活力的领域。

2.1 聚类的定义

1974年Everitt 把聚类进行定义；同一类内对象相似，不同类内对象不相似。
同一类内两点间距应小于不同类内两点的距离，类是多维空间中数据密度较高的联通区域，通过数据密度较小的区域隔开。

聚类实际上是一个无监督的分类，它没有任何先验知识可用。

2.2 K-means的局限性

聚类数K是需要用户事先指定的，大部分是给出一个范围，然后去尝试，根据一定的聚类结果标准判定K的取值，这在一定程度上加大了算法的复杂性；

猜你喜欢

转载自blog.csdn.net/weixin_42521185/article/details/124946021

论文学习——分段时间序列相似性研究与应用

论文学习——基于Hadoop的水文时间序列相似性研究与应用

论文学习——水文时间序列相似性查询的分析与研究

论文学习——基于语义相似的水文时间序列相似性挖掘

论文学习——多元时间序列相似性度量方法

论文学习——基于XGBoost算法的多元水文时间序列趋势相似性挖掘

论文学习——多度量水文时间序列相似性分析

论文学习——基于优化DTW算法的水文要素时间序列数据相似性分析

论文学习——基于模式距离度量的时间序列相似性搜索

论文学习——基于斜率表示的时间序列相似性度量方法

论文学习——基于极值点特征的时间序列相似性查询方法

论文学习——一种基于DTW聚类的水文时间序列相似性挖掘方法

论文学习——基于降雨类型直方图分析的降雨站点相似性研究

章硕士论文学习——第二章数据挖掘中的聚类方法+时间序列相似性分析

时间序列相似性

论文学习——鄱阳湖星子站水位时间序列相似度研究

时间序列曲线相似性

十二，时间序列趋势相似性度量方法的研究-DPM

论文学习——特征点分段提取的时间序列匹配方法

专利学习——一种基于变量相关性的多元时间序列相似性搜索方法

论文学习——时间序列数据挖掘中的动态时间弯曲研究综述

论文学习——时间序列的距离模式

论文学习——基于知识粒度的时间序列异常检测研究

序列相似性比对（1）

离散序列的相似性度量

机器学习中的相似性度量

【论文泛读07】回顾时空相似性：交通预测的深度学习框架

余弦相似性的应用: 找出相似文章

论文学习——水文时间序列模体挖掘

比较相似性

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)