学习笔记
参考书目:《计量经济学》、《时间序列分析及应用R语言》、《计量经济学基础》、《计量经济学模型与R语言应用》
为什么平稳如此重要
我们知道若随机时间序列
Xt有如下性质:
①均值
E(Xt)=μ ,均值是与时间
t无关的常数
②方差
Var(Xt)=σ2 , 方差是与时间
t无关的常数
③协方差
Cov(Xt,Xt+k)=γk ,协方差只与时间间隔
k有关.
则称随机时间序列
Xt具有弱平稳型。
此时,如果我们把
X的原点从
Xt移到
Xt+m,那么
Xt+m具有和
Xt一样的均值、方差和自协方差。简而言之,如果一个时间序列是平稳的,那么不管在什么时间测量,它的均值、方差和自协方差都保持不变,即它们不随时间而变化。这种平稳的时间序列,有回到其均值的趋势,而且围绕其均值的波动具有大致恒定的振幅。应该指出,一个平稳过程均值复原(即回到均值)的速度取决于其自协方差,自协方差越小速度越快,自协方差越大,速度越慢。
而如果一个过程是非平稳的,那么要么它的均值随着时间变化,要么方差随着时间变化,或者二者同时发生变化。
扫描二维码关注公众号,回复:
11005377 查看本文章
为什么平稳时间序列如此重要呢? 因为如果一个序列是非平稳的,那么我们就只能研究其在研究期间的行为,我们无法把它推广到其他期间。因此,从预测的角度来看,如果序列非平稳则没有什么研究价值。
自回归AR模型
在讨论了平稳时间序列的重要性之后,接下来的一个实际问题就是如何建立一个平稳时间序列的模型,以及如何利用所建的模型进行预铡。与经典回归分析不同的是,我们这里所建立的时间序列模型主要不是以不同变量间的因果关系为基础,而是寻找时间序列自身的变化规律。同样地,在预测一个时间序列未来的变化时,我们不再使用一组与之有因果关系的其他变量,而只是用该序列的过去行为来预测未来。
一阶自回归过程
存在这种用过去行为来预测未来的最简单的例子是一阶自回归模型,简记为
AR(1):
Yt=ϕYt−1+et(1)
其中
et为白噪声,假设
et独立于
Yt−1,Yt−2,Yt−3,...,假设过程的均值已经被去掉,序列的均值为零.
我们知道只有产生过程是平稳的,用该模型进行预测才有意义。因此我们首先研究该过程的平稳条件。
对于一阶自回归模型,有如下递推式:
Yt=ϕYt−1+et=et+ϕ(ϕYt−2+et−1)......=et+ϕet−1+ϕ2et−2+ϕ3et−3...(2)
可以看到,一阶自回归过程(1)式可以表示成白噪声序列的线性组合。
由于
E(et)=0,故
E(Yt)=0, 则平稳条件①成立。
对(2)式两边取方差:
var(Yt)=σe2(1+ϕ2+ϕ4+...)(3)
当且仅当
∣ϕ∣<1时,(3)式才有:
var(Yt)=1−ϕ2σe2(4)
则,只有满足
∣ϕ∣<1的条件时,平稳条件②才成立。
同时,对于(2)式有:
Yt+k=et+k+ϕet+k−1+ϕ2et+k−2+ϕ3et+k−3...(5)
则
Yt与
Yt+k的协方差为:
cov(Yt,Yt+k)=E(Yt∗Yt+k)=σe2ϕk(1+ϕ2+ϕ4+...)(6)
当且仅当
∣ϕ∣<1时,(6)式才有:
cov(Yt,Yt+k)=ϕk1−ϕ2σe2=ϕkvar(Yt)(7)
则(7)式表明
cov(Yt,Yt+k)只与时间间隔
k有关,与时间点
t无关,则平稳条件③成立。
综上所述,在条件
et独立于
Yt−1,Yt−2,Yt−3,...和
σe2>0的情况下,当且仅当
∣ϕ∣<1时
AR(1)的递归定义的解是平稳的,
∣ϕ∣<1通常称为
AR(1)过程的平稳条件。
二阶自回归过程
现考虑满足以下方程的序列:
Yt=ϕ1Yt−1+ϕ2Yt−2+et(8)
其中
et为白噪声,假设
et独立于
Yt−1,Yt−2,Yt−3...
为了证明平稳性,引入AR特征多项式:
ϕ(x)=1−ϕ1x−ϕ2x2(9)
和相应的AR特征方程:
1−ϕ1x−ϕ2x2=0(10)
二次方程总是有两个根(可能有复数根),这两个根就叫特征根。
可以证明,当
et独立于
Yt−1,Yt−2Yt−3...的条件下,当且仅当AR特征方程的根的绝对值(模)大于1时,方程(10)才存在平稳解。这个结论,可以不加任何改变地推广到p阶的情况.
在二阶自回归模型中,二次特征方程的根易找到为:
−2ϕ2ϕ1±ϕ12+4ϕ2
(11)
为了满足平稳条件,要求根的绝对值大于,当且仅当满足以下条件:
ϕ1+ϕ2<1ϕ2−ϕ1<1∣ϕ2∣<1
与
AR(1)一样,我们称此为
AR(2)模型的平稳条件。
下图显示了
AR(2)模型的平稳区域:
一般自回归过程
考虑p阶自回归模型:
Yt=ϕ1Yt−1+ϕ2Yt−2+...+ϕpYt−p+et(12)
有AR特征多项式:
ϕ(x)=1−ϕ1x−ϕ2x2−...−ϕpxp(13)
和相应的特征方程:
1−ϕ1x−ϕ2x2−...−ϕpxp=0(14)
假设
et独立于
Yt−1,Yt−2,Yt−3... ,当且仅当AR特征方程的每一个根的绝对值(模)大于1时方程(14)才存在平稳解,为了保证特征方程根的模大于1,以下两个不等式是必要条件但不是充分条件:
{ϕ1+ϕ2+...+ϕp<1∣ϕ∣<1(15)
以下不等式为充分条件:
∣ϕ1∣+∣ϕ2∣+...+∣ϕp∣<1
R语言实现
现在我们模拟二阶自回归过程,并检验其平稳性:
library(tseries)
set.seed(1236)
data01 <- arima.sim(n = 50, list(ar =c(0.8, -0.5)))
plot(data01, main = '时序图', type='o')
adf.test(data01)
时序图:
单位根检验结果:
Augmented Dickey-Fuller Test
data: data01
Dickey-Fuller = -3.8032, Lag order = 3, p-value = 0.02523
alternative hypothesis: stationary
我们看到p值小于0.05的显著性水平,拒绝原假设,则二阶自回归过程是平稳的。
后记:此Blog经过了二次修改,之前在模拟二阶ar模型时,将自回归系数写为了0.8和0.5这不满足平稳性条件,在用R模拟时,程序应该是会报错的,但笔者查看了一下历史记录,发现模拟的时候自回归系数写的是0.8和-0.5,结果写Blog的时候就变成了了0.8和0.5 ???故,引以为戒