[统计学笔记] (十二)时间序列分析和预测

(十二)时间序列分析和预测

时间序列数据用于描述现象随时间发展变化的特征。

时间序列(times series)是同一现象在不同时间的相继观察值排列而形成的序列。经济数据大多数以时间序列的形式给出。

时间序列及其分解

时间序列可以分为平稳序列和非平稳序列两大类。

平稳序列是基本上不存在趋势的序列。这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,波动可以看成是随机的,如图所示:

非平稳序列(non-stationary series)是包含趋势、季节性或周期性的序列,它可能只含有其中一种成分,也可能含有几种成分。因此非平稳序列又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

趋势(Trend):是时间序列在长期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势。时间序列中的趋势可以是线性的,也可以是非线性的。

季节性(seasonality)也称季节变动(seasonal fluctuation),它是时间序列在一年内重复出现的周期性波动。例如:在商业活动中,常常听到的“销售旺季”或“销售淡季”这类术语。其本质上指的是一种周期性的变化。

含有季节成分的序列可能含有趋势,也可能不含有趋势。

周期性(cyclicity)也称循环波动(cyclical fluctuation),是时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动。周期性通常是由商业和经济活动引起的,它不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相同的交替波动;它也不同于季节变动,季节变动有比较固定的规律,而且变动周期大多为一年,循环波动则无固定规律,变动周期多在一年以上,且周期长短不一。周期性通常是由经济环境的变化引起的。

除此之外,还有些偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。时间序列中除去趋势、周期性和季节性之后的偶然性波动称为随机性(randomness),也称不规则波动(irregular variations)。 

时间序列的成分可以分为四种:趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。

构成要素:长期趋势,季节变动,循环变动,不规则变动。
1)长期趋势( T )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。
2)季节变动( S )现象在一年内随着季节的变化而发生的有规律的周期性变动。
3)循环变动( C )现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动。
4)不规则变动(I )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型。


时间序列类型

绝对数时间序列


时期序列:由时期总量指标排列而成的时间序列 。
时期序列的主要特点有:
1)序列中的指标数值具有可加性。
2)序列中每个指标数值的大小与其所反映的时期长短有直接联系。
3)序列中每个指标数值通常是通过连续不断登记汇总取得的。


时点序列:由时点总量指标排列而成的时间序列
时点序列的主要特点有:
1)序列中的指标数值不具可加性。
2)序列中每个指标数值的大小与其间隔时间的长短没有直接联系。
3)序列中每个指标数值通常是通过定期的一次登记取得的。

相对数时间序列

把一系列同种相对数指标按时间先后顺序排列而成的时间序列叫做相对数时间序列。


平均数时间序列

平均数时间序列是指由一系列同类平均指标按时间先后顺序排列的时间序列。

编制时间序列数据时需要注意的问题

保证序列中各期指标数值的可比性

  • 时期长短最好一致
  • 总体范围应该一致
  • 指标的经济内容应该统一
  • 计算方法应该统一
  • 计算价格和计量单位可比

增长率分析

是对现象在不同时间的变化状况所做的描述。由于对比的基期不同,增长率有不同的计算方法。

(1)增长率(growth rate):增长速度,是时间序列中报告期观察值与基期观察值之比减1后的结果,用%表示。由于对比的基期不同,可分为环比增长率和定基增长率。

环比增长率:是报告期观察值与前一时期观察值之比减1,说明现象逐期增长变化的程度;

定基增长率是报告期观察值与某一固定时期观察值之比减1,说明现象在整个观察期内总的增长变化程度。

设增长率为G:          环比增长率 :

                                   定基增长率 :

(2)平均增长率(average rate of increase):平均增长速度,是时间序列中逐期环比值(环比发展速度)的几何平均数减1的结果:

   n:环比值的个数

(3)增长率分析中应注意的问题

  • 当时间序列中的观察出现0或负数时,不宜计算增长率。这种序列计算增长率,要么不符合数学公理,要么无法解释其实际意义。可用绝对数进行分析。
  • 有些情况下,不能单纯就增长率论增长率,注意增长率与绝对水平结合起来。增长率是一个相对值,与对比的基数值的大小有关。这种情况,计算增长1%的绝对值来克服增长率分析的局限性:增长1%的绝对值表示增长率每增长一个百分点而增加的绝对数量:增长1%的绝对值=前期水平/100

时间序列预测的程序

时间序列分析的主要目的之一是根据已有的历史数据对未来进行预测。时间序列含有不同的成分,如趋势、季节性、周期性和随机性。对于一个具体的时间序列,它可能含有一种成分,也可能同时含有几种成分,含有不同成分的时间序列所用的预测方法是不同的。

预测步骤:

第一步:确定时间序列所包含的成分,确定时间序列的类型

第二步:找出适合此类时间序列的预测方法

第三步:对可能的预测方法进行评估,以确定最佳预测方案

第四步:利用最佳预测方案进行预测

1、确定时间序列成分

(1)确定趋势成分

确定趋势成分是否存在,可绘制时间序列的线图,看时间序列是否存在趋势,以及存在趋势是线性还是非线性。

利用回归分析拟合一条趋势线,对回归系数进行显著性检验。回归系数显著,可得出线性趋势显著的结论。

(2)确定季节成分

确定季节成分是否存在,至少需要两年数据,且数据需要按季度、月份、周或天来记录。可绘图,年度折叠时间序列图(folded annual time series plot),需要将每年的数据分开画在图上,横轴只有一年的长度,每年的数据分别对应纵轴。如果时间序列只存在季节成分,年度折叠时间序列图中的折线将会有交叉;如果时间序列既含有季节成分又含有趋势,则年度折叠时间序列图中的折线将不会有交叉,若趋势上升,后面年度的折线将会高于前面年度的折线,若下降,则后面年度的折线将会低于前面年度的折线。

2、选择预测方法
确定时间序列类型后,选择适当的预测方法。利用时间数据进行预测,通常假定过去的变化趋势会延续到未来,这样就可以根据过去已有的形态或模式进行预测。时间序列的预测方法:传统方法:简单平均法、移动平均法、指数平滑法等,现代方法:Box-Jenkins 的自回归模型(ARMA)。

一般来说,任何时间序列都会有不规则成分存在,在商务和管理数据中通常不考虑周期性,只考虑趋势成分和季节成分。

不含趋势和季节成分的时间序列,即平稳时间序列只含随机成分,只要通过平滑可消除随机波动。因此,这类预测方法也称平滑预测方法。

3、预测方法的评估
在选择某种特定的方法进行预测时,需要评价该方法的预测效果或准确性。评价方法是找出预测值与实际值的差距,即预测误差。最优的预测方法就是预测误差达到最小的方法。

预测误差计算方法:平均误差,平均绝对误差、均方误差、平均百分比误差、平均绝对百分比误差。方法的选择取决于预测者的目标、对方法的熟悉程度。

(1)平均误差(mean error):Y:观测值,F:预测值,n预测值个数

              

由于预测误差的数值可能有正有负,求和的结果就会相互抵消,这种情况下,平均误差可能会低估误差。

(2)平均绝对误差(mean absolute deviation)是将预测误差取绝对值后计算的平均无擦,MAD:

        

平均绝对误差可避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小。

(3)均方误差(mean square error):通过平方消去误差的正负号后计算的平均误差,MSE:

     

(4)平均百分比误差和平均绝对百分比误差

ME,MAD,MSE的大小受时间序列数据的水平和计量单位的影响,有时并不能真正反映预测模型的好坏,只有在比较不同模型对同一数据的预测时才有意义。平均百分比误差(mean percentage error,MPE)和平均绝对百分比误差(mean absolute percentage error,MAPE)则不同,它们消除了时间序列数据的水平和计量单位的影响,是反映误差大小的相对值。

 

平稳序列的预测

平稳时间序列只含有随机成分,预测方法:简单平均法、移动平均法、指数平滑法。

主要通过对时间序列进行平滑以消除随机波动,又称平滑法。平滑法可用于对时间序列进行短期预测,也可对时间序列进行平滑以描述序列的趋势(线性趋势和非线性趋势)。

(1)简单平均法:根据已有的t期观察值通过简单平均法来预测下一期的数值。设时间序列已有的t期观察值为

,则t+1期的预测值为:

到了t+1期后,有了t+1期的实际值,t+1期的预测误差为:e_{t+1}=Y_{t+1}-F_{t+1}

t+2期预测值:

简单平均法适合对较为平稳的时间序列进行预测,即当时间序列没有趋势时,用该方法比较好。但如果时间序列有趋势或季节成分,该方法的预测则不够准确。简单平均法将远期的数值和近期的数值看作对未来同等重要。从预测角度,近期的数值比远期的数值对未来有更大的作用,因此简单平均法预测的结果不够准确。

(2)移动平均法(moving average):通过对时间序列逐期递移求得平均数作为预测值的一种预测方法,有简单移动平均法(simple moving average)和加权移动平均法(weighted moving average).

简单移动平均将最近k期数据加以平均,作为下一期的预测值。设移动平均间隔为k(1<k<t),则t期的移动平均值为:

是对时间序列的平滑结果,通过这些平滑值可描述出时间序列的变化形态或趋势。也可以用来预测。

t+1期的简单移动平均预测值为:

t+2期的简单移动平均预测值为:

移动平均法只使用最近k期的数据,在每次计算移动平均值时,移动的间隔都为k,也适合对较为平稳的时间序列进行预测。应用关键是确定合理的移动平均间隔k。对于同一个时间序列,采用不同的移动间隔,预测的准确性是不同的。可通过试验的方法,选择一个使均方误差达到最小的移动间隔。移动间隔小,能快速反映变化,但不能反映变化趋势;移动间隔大,能反映变化趋势,但预测值带有明显的滞后偏差。

移动平均法的基本思想:移动平均可以消除或减少时间序列数据受偶然性因素干扰而产生的随机变动影响,适合短期预测。

(3)指数平滑法(exponential smoothing)是通过对过去的观察值加权平均进行预测,使t+1期的预测值等t期的实际观察值与t期的预测值的加权的平均值。指数平滑法是从移动平均法发展而来,是一种改良的加权平均法,在不舍弃历史数据的前提下,对离预测期较近的历史数据给予较大权数,权数由近到远按指数规律递减,因此称指数平滑。指数平滑有一次指数平滑法、二次指数平滑法、三次指数平滑法等。

一次指数平滑法也称单一指数平滑法(single exponential smoothing),只有一个平滑系数,且观察值离预测时期越久远,权数变得越小。一次指数平滑是将一段时期的预测值与观察值的线性组合作为t+1时期的预测值,预测模型为:F_{t+1}=\alpha Y_t+(1-\alpha )F_t      \alpha:平滑系数(0\leq \alpha\leq 1

t+1期的数据是t期的实际观察值与t期的预测值的加权平均。1期的预测值=1期的观察值

2期预测值:F_{2}=\alpha Y_1+(1-\alpha )F_1=\alpha Y_1+(1-\alpha )Y_1=Y_1

3期预测值:F_{3}=\alpha Y_2+(1-\alpha )F_2=\alpha Y_2+(1-\alpha )Y_1

4期预测值:F_{4}=\alpha Y_3+(1-\alpha )F_3=\alpha Y_3+\alpha (1-\alpha )Y_2+ (1-\alpha )^2Y_1

对指数平滑法的预测精度,用均方误差来=衡量:

F_{t+1}=\alpha Y_t+(1-\alpha )F_t

          =F_t+\alpha (Y_t-F_t)

是t期的预测值加上用调整的t期预测误差(Y_t-F_t)。

使用指数平滑法时, 关键问题是确定一个合适的平滑系数\alpha,不同\alpha的对预测结果产生不同的影响。

\alpha=0,预测值仅仅是重复上一期的预测结果;\alpha=1,预测值就是上一期的实际值;

\alpha越接近1,模型对时间序列变化的反应就越及时,因为它给当前的实际值赋予了比预测值更大的权数;

\alpha越接近0,给当前的预测值赋予了更大的权数,模型对时间序列变化的反应就越慢。

当时间序列有较大随机波动时,选较大\alpha,以便能很快跟上近期的变化;当时间序列比较平稳时,选较小\alpha

实际应用中,需考虑预测误差,用均方误差衡量预测误差大小。确定时,可选择几个\alpha进行预测,然后找出预测误差最小的作为最后的\alpha值。

与移动平均法一样,一次指数平滑法可用于对时间序列进行修匀,以消除随机波动,找出序列的变化趋势。

用一次指数平滑法进行预测时,一般取值不大于0.5,若大于0.5,才能接近实际值,说明序列有某种趋势或波动过大。

阻尼系数 \beta=1-\alpha  ,阻尼系数越小,近期实际值对预测结果的影响越大,反之,越小。阻尼系数是根据时间序列的变化特性来选取。

指数平滑法

指数平滑法实际上是一种特殊的加权移动平均法。

其特点是:

第一,指数平滑法进一步加强了观察期近期观察值对预测值的作用,对不同时间的观察值所赋予的权数不等,从而加大了近期观察值的权数,使预测值能够迅速反映市场实际的变化。权数之间按等比级数减少,此级数之首项为平滑常数a,公比为(1- a)。

第二,指数平滑法对于观察值所赋予的权数有伸缩性,可以取不同的a 值以改变权数的变化速率。如a取小值,则权数变化较迅速,观察值的新近变化趋势较能迅速反映于指数移动平均值中。因此,运用指数平滑法,可以选择不同的a 值来调节时间序列观察值的均匀程度(即趋势变化的平稳程度)。

据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑法和三次指数平滑法等。


趋势型序列的预测

趋势预测分析法亦称时间序列预测分析法,是根据事业发展的连续性原理,应用数理统计方法将过去的历史资料按时间顺序排列,然后再运用一定的数字模型来预计、推测计划期产(销)量或产(销)额的一种预测方法。
由于趋势测计划期间的销售数量或销售金额预测分析法所采取的数学方法不同,又可分为:

  • 算术平均法。以过去若干时期的销售量(或销售金额)的算术平均数作为计划期的销售预测数。这一方法的优点是计算简单,但由于取的是平均值,因而是比较粗糙的,测出的预计数量与实际数量会发生较大的误差,所以这种方法只适用于销售量比较稳定的产品,如没有季节性的食品、日用品等。
  • 移动加权平均法。是根据过去若干时间的销售量(或销售金额)按其距计划期的远近分别进行加权(近期所加权数大些,远期所加权数小些;然后计算其加权平均数,作为计划期的销售预测数。所谓“移动”是对计算平均数的讨期不断往后推移。
  • 指数平滑法。在预则计划期销售量(或销售金额)时,导入平滑系数(或称加权因子)进行计算。指数平滑法与移动加权平均法实质上是近似的,其优点是可以排除在实际销售中所包含的偶然因素的影响。但确定平滑指数的值还带着一定的主观成分。平滑系数越大,则近期实际数对预测结果的影响越大,反之则小。所以采用较小的平滑系数,使此法的平均数能反映观察值变动的长期趋势;也可以采用较的平滑系数,使此法的平均数能反映观察值丘期的变动趋势,以便进行近期的销售预测,

复合型序列的分解预测

复合型序列是指含有趋势、季节、周期和随机成分的序列。

这类序列的预测方法通常是将时间序列的各个因素依次分解出来,然后进行预测。

由于周期成分的分析需要有多年的数据,实际中很难得到多年的数据,因此采用的分解模型为:

\large Y_{t} = T_{t}\times S_{t} \times I_{t}

这一模型表示该时间序列中含有趋势成分、季节成分和随机成分。

这类序列的预测方法主要有季节性多元回归模型、季节自回归模型和时间序列分解法预测等。

分解法预测通常按下面的步骤进行:

第1步:确定并分离季节成分。

第2步:建立预测模型并进行预测。

第3步:计算最后的预测值。

             用预测值乘以相应的季节指数,得到最终的预测值。

季节指数(seasonal index)刻画了序列在一个年度内各月或各季节的典型季节特征。

季节指数的计算方法有多种,例如平均趋势剔除法。

“移动平均趋势剔除法”来测定季节变动趋势。其基本步骤如下:

第一,先根据各年的季度(或月度)资料(Y)计算四季(或12个月)的移动平均数,然后为了“正位”,再计算二季(月)移动平均数,作为各期的长期趋势值(T)。

第二,将实际数值(Y)除以相应的移动平均数(T),得到各期的Y/T。这就是消除了长期趋势影响的时间数列,它是一个相对数,称为季节指数。其结果为表中第四列数值。

第三,将Y/T重新按“同期平均法”计算季节比率的方式排列。然后,按照该方法要求,先计算“异年同季平均数”,然后再计算“异年同季平均数的平均数”,即消除长期趋势变动后,新数列的序时平均数;最后,计算季节比率并画图显示。


季节波动

季节波动是指某些社会现象由于受到社会因素和自然因素的影响,在一年之内随着季节的更替而呈现的有规律性的周期性波动。在一年之内,由于季节的变动,会使某些社会经济现象(一定的时间序列)产生规律性的变化,这种规律性变化通常称之为季节波动。如食品、服装、某些季节性特点很强的产品或商品等,它们的生产和消费都随季节的变换而呈现周期性的波动,出现“旺季”和“淡季”。

季节波动具有三个明显的特征:
(1)季节波动有一定的规律性和周期性;
(2)季节波动每年重复出现,具有重复性;
(3)季节波动的波动轨迹具有相似性。 

测定季节波动的方法很多,常用的两种方法为:同期平均法和趋势剔除法。 
同期平均法
这种方法是测定季节波动最简便的方法。它是以若干年资料数据求出同月(季)的平均水平与全年总月(季)水平,二者对比得出各月(季)的季节指数来表明季节波动的程度。按月平均法可以分为直接按(季)月平均法和比率按月平均法两种。  


1、直接按月平均法
直接按月(季)平均法将整个时问序列的趋势值视为常数。计算步骤如下:
(1)计算各年同月(季)的平均数;
(2)计算各年所有月份(或季度)的总平均数;
(3)计算季节指数。 [4] 
2、比例按月(季)平均法
这种方法是在按月(季)平均之前,先将历年各月(季)的数据同其本年的月(季)平均数相比,得出说明该年度的季节比率;然后再将各年度同期(月或季)的比率进行平均,求出季节指数。 


移动平均趋势剔除法
在具有明显的长期趋势变动的数列中,为了测定季节波动,必须先将趋势变动因素加以剔除。假定趋势变动、季节波动、循环波动和不规则变动对时间序列影响可以用乘法模型反映,用移动平均趋势剔除法测定季节波动的步骤如下:
(1)对原时间序列求移动平均数,作为相应时期的趋势值。
(2)剔除原数列中的趋势变动,即将原数列各项除以移动平均数的对应时间数据。
(3)以消除趋势变动后的数列计算季节指数,测定季节波动。 

发布了646 篇原创文章 · 获赞 198 · 访问量 69万+

猜你喜欢

转载自blog.csdn.net/seagal890/article/details/105588571