时序预测

单实例单指标过去3个月是10万,单region有1万实例,单region单指标是10亿数据,6节点集群,

时间序列可以分为平稳序列,即存在某种周期,季节性及趋势的方差和均值不随时间变化的序列(平稳就是围绕着一个常数上下波动,及非平稳序列

arima和arma区别:关键的差别是有没有进行差分运算,不过差分运算会让人难懂模型的经济意义,差分的阶数也不能太高,否则会浪费过多的信息。

传统时序数据分析预测

  • 怎么检测序列是否平稳?(自相关系数,偏相关系数)
  • 1. 肉眼画图,值是否围绕一条线上下波动
  • 2. ADF单位根检验,如果没有单位根,那就是平稳序列。  ADF检验的原假设是存在单位根,只要这个统计值是小于1%水平下的数字就可以极显著的拒绝原假设,认为数据平稳

   [时间序列分析][3]--自相关系数和偏自相关系数

   https://zhuanlan.zhihu.com/p/26525852

  时间序列分析(一) 如何判断序列是否平稳

  https://lbxc.iteye.com/blog/1522257

  • 平稳序列可以用传统的金融时间序列分析

传统预测方法可以分为两种,一种是更加传统的,如移动平均法,指数平均法等;一种是用的还算较多的,即AR,MA,ARMA等,下面主要介绍一下这三种方法,这类方法比较适用于小规模,单变量的预测,比如某门店的销量预测等:

(1)AR模型

具有如下结构的模型称为p阶自回归模型,简记为AR(p):

随机变量Xt的取值Xt是前p期xt−1,xt−2,...,xt−pxt−1,xt−2,...,xt−p的多元线性回归,认为xt主 要受过去p期的序列值影响。误差项是当前的随机干扰εt,为零均值白噪声序列。(2)MA模型

具有如下结构的模型称为q阶自回归模型,简记为MA(q):

即在t时刻的随机变量Xt的取值Xt是前q期的随机扰动εt-1,εt−2,...,εt−qεt−1,εt−2,...,εt−q的多元线性函数。误差项是当期的随机干扰εt,为零均值白噪声序列,μ是序列{Xt}的均值。认为xt主要受过去q期的误差项影响。

(3)ARMA模型

ARMA模型是最常用的平稳序列拟合模型,随机变量Xt的取值xt不仅与以前p期的序列值有 关还与前q期的随机扰动有关。

这三种模型适用的情景也不同,具体的可以查阅一下。总的来说,基于此类方法的建模步骤是,首先需要对观测值序列进行平稳性检测,如果不平稳,则对其进行差分运算直到差分后的数据平稳在数据平稳后则对其进行白噪声检验,白噪声是指零均值常方差的随机平稳序列;如果是平稳非白噪声序列就计算ACF(自相关系数)、PACF(偏自相关系数),进行ARMA等模型识别,对已识别好的模型,确定模型参数,最后应用预测并进行误差分析。

时间序列分析之指数平滑法(holt-winters及代码)

https://zhuanlan.zhihu.com/p/43353740


机器学习时序数据预测

时间序列的特征工程会使用滑动窗口,即计算滑动窗口内的数据指标,如最小值,最大值,均值,方差等来作为新的特征。

对于机器学习方法,xgboost,随机森林及SVM这些都是可以用的,也没有说哪个模型好用,需要看具体的场景及实验,总之就是看效果说话

https://blog.csdn.net/weixin_41512727/article/details/85706521


深度学习时序预测

https://zhuanlan.zhihu.com/p/60217422

(1)提出了基于生成对抗网络(GAN)的多变量时间序列异常检测模型。

(2)以 LSTM 为基本模型来捕获时间上的依赖关系,并将其嵌入到 GAN 的框架中。

(3)同时利用 GAN 的生成器和判别器来检测异常,利用判别器得到判别损失,利用生成器得到重建的损失。


发布了59 篇原创文章 · 获赞 11 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/u013385018/article/details/93884260