浅尝辄止_数学建模(笔记_时间序列分析及其SPSS实现)

本文多是广泛的概念和SPSS运用,没有具体的推导过程和深入的探究

一、时间序列分析

时间序列分析大致可以分成三大部分,分别是描述过去、分析规律和预测未来。

1.具体步骤:

  1. 做时间序列图
  2. 判断时间序列包含的变动成分
  3. 时间序列分解(有周期性且包含长期趋势、季节变动或循环变动)
  4. 建立时间序列分析模型
  5. 预测未来的指标数值

二、基本知识

1.时间序列数据

时间序列数据:对同一对象在不同时间连续观察所取得的数据。
 
例如:中国历年来的GDP数据,某一地方一天的温度数据…


2.时间序列的基本概念

  • 时间序列也称为动态序列,是指某个现象的指标数值按照时间顺序排列而成的数值序列。
     

  • 时间序列由两个组成要素构成:
    1.第一要素是时间要素;年、季度、月、周、日、小时、分、秒…
    2.第二要素是数值要素;

  • 时间序列根据时间和数值性质的不同,可以分为时期时间序列和时点时间序列:
    1.时期序列中,数值要素反映现象在一定时期内发展的结果;时期序列数值要素可以相加,且有意义,例如中国历年以来的的GDP…
    2.时点序列中,数值要素反映现象在一定时间点上的瞬间水平。时点序列数值要素不可以相加,无意义,例如某地点一天时间的温度数据…


3.时间序列分解

 因为时间序列是某个指标数值的长期变化的数值表现,所以时间序列数值变化背后必然蕴含着数值变换的规律性,这些规律性就是时间序列分析的切入点。
 一般情况下,时间序列的数值变化规律有四种:长期变动趋势、季节变动规律、周期变动规律和不规则变动(随机扰动项)。
 一个时间序列往往是以上四类变化形式的叠加。

  • 长期趋势:T
    长期趋势指的是统计指标在相当长的一段时间内,受到长期趋势因素的影响,表现出持续上升或者持续下降的趋势;例如随着国家经济的发展,人均收入逐渐提升。
  • 季节趋势:S
    季节趋势是指由于季节的转变使得指标指数发生周期性变动。这里的季节是广义的,一般以月、季、周为时间单位,不能以年为单位;例如雪糕和棉衣的销量随着季节气温的变化而周期性变化
  • 循环变动趋势:C
    循环变动趋势与季节变动的周期不同,循环变动趋势通常以若干年为周期,在曲线图上表现为波浪式的周期变动。这种周期变动的特征表现为增加和减少交替出现,但是并不具严格规则的周期性连续波动。
  • 不规则变动趋势:I
    不规则变动是由于某些随机因素导致的数值变化,这些因素的作用是不可预知和没有规律的,可以视为由于众多偶然因素对时间序列造成的影响(在回归中又被称为扰动项)

4.叠加模型和乘积模型

(1)如果四种变动之间是相互独立的关系,那么叠加模型可以表示为: Y = T + S + C + I Y=T+S+C+I
(2)如果四种变动之间存在相互影响关系,那么应该使用乘积模型: Y = T S C I Y=T*S*C*I
注意:
数据具有周期性才能使用时间序列分解。

建议:
在具体的时间序列图上,如果随着时间的推移,序列的季节波动变得很大,则反应各种变动之间的关系发生变化,建议使用乘积模型;反之,如果时间序列图的波动保持恒定,则可以直接使用叠加模型;当然,如果不存在季节波动,则两种分解均可以。


二、SPSS软件处理时间序列

1.建模的思路

  1. 处理数据的缺失值问题、生成时间变量并绘制出时间序列图;
  2. 数据是否为季度数据或者月份数据(至少两个完整的周期,即两年)。如果是的话,则要观察图形中是否存在季节性波动;
  3. 根据时间序列图大致判断是否为平稳序列(数据围绕着均值上下波动,无趋势和季节性);
  4. 打开SPSS,分析 — 时间序列预测 — 创建传统模型,看看专家模拟器给出的最优的模型类型;利用SPSS带有的专家模拟器,其帮助用户选择合适的模型,并建立模型。
  5. 如果最后的结果是ARIMA(p,0,q)模型,那么可以绘制出时间序列的样本ACF个PACF图形进行分析;如果得到的是ARIMA(p,1,q)模型,可以先对数据进行一阶差分,再用ACF和PACF图形分析;如果得到的结果与季节性相关,可以考虑使用时间序列分解。

2.数据预处理:补充缺失值

  1. 缺失值发生在时间序列的开头或者尾部,可采用直接删除的方法;
  2. 缺失值发生在时间序列的中间位置,则不能删除。删除后原有的时间序列会错位,因此可以采用替换缺失值的方法。

导入数据 — 转换 — 替换缺失值 — 右移相关变量 — 输入名称,选择方法 — 确定


3.定义时间变量

导入数据 — 数据 — 定义日期和时间 — 选择适合的个案 — 输入第一个个案的信息 — 确定
重要!


4.时间序列图(时序图)

导入数据 — 分析 — 时间序列预测 — 序列图 — 右移变量(即纵坐标)— 右移时间轴标签(即横坐标)— 选择性勾选“每个变量对应一个图表” — 选择性填写”时间线” — 确定 — 双击结果图,进行美化 — 在变量视图中更改变量名称,从而使得时序图中标注的改变


5.季节性分解

导入数据 — 分析 — 时间按序列预测 — 季节性分解 — 右移相关变量 — 选择乘性/加性 — 勾选移动平均值权重(奇数用“所有点相等”,偶数用“端点按0.5加权”)—确定
结果解读:

  1. ERR_1代表不规则变动I(残差或者误差值);SAS_1代表季节性调整后系列(T+C+I);SAF_1代表季节性调整因子(S);STC_1代表趋势循环成分(T+C)。
  2. 加性:季节因子和为0,每个周期的数值代表比平均值高或低的数值;乘性:季节因子乘为1,每个周期的数值代表是平均数值的倍数。

6.SPSS时间序列建模器

分析 — 时间序列预测 — 创建传统模型 — 变量 — 右移因变量 — 条件 — 离群值 — 勾选自动检测离群值,勾选所有要检测的离群值类型(筛选异常值)— 统计 — 单个模型的统计 — 勾选参数估算值 — 图 — 勾选拟合值、残差相关系数和残差偏相关系数 — 保存 — 勾选预测值、置信区间的上限和下限 — 选项 — 勾选预测期结束后的第一个个案到指定日期之间的个案 — 输入想要预测到的日期

标注:

  1. 预测值和拟合值是不同的,预测值是将样本外年份的数据带入模型计算得到的,而拟合值是将样本年份的数据重新带入模型计算得到的。
  2. 这里保存的残差ACF和PACF图形可以辅助判断断残值是否为白噪声,即该时间序列是否能被模型识别完全。
  3. 一般比较两个模型的好坏,应当使用平稳的 R 2 R^2 ,或者标准化BIC(BIC准则),这两个指标即考虑了拟合的好坏,又考虑了模型的复杂程度;
  4. R 2 R^2 可以用来反映线性模型拟合的好坏,越接近于1,拟合越准确。
  5. 正态化BIC的结果越小,模型越合适。
  6. 输出结果表格中,模型统计 — 杨·博克斯 — 显著性,这个数值大于0.05,则表示残差是白噪声,模型可以识别完全。
  7. 利用ACF图和PACF图,可在论文中增添一句话:从残差的ACF和PACF图形可以看出,所有滞后阶数的自相关系数和偏自相关系数均和0没有显著的差异。

猜你喜欢

转载自blog.csdn.net/ICISTRUE/article/details/108374606