自回归(Autoregressive Models,AR)模型

已知在t−1时刻的数据rt−1,在预测t时刻rt时可能是有用的!

根据这点我们可以建立下面的模型:


其中{at}是白噪声序列,这个模型与简单线性回归模型有相同的形式,这个模型也叫做一阶自回归(AR)模型,简称AR(1)模型

从AR(1)很容易推广到AR(p)模型:

AR(p)模型的特征根及平稳性检验

我们先假定序列是弱平稳的,则有;


因为{at}是白噪声序列,因此有:


所以有:


根据平稳性的性质,又有

 ,从而:


对式2.1,假定分母不为0, 我们将下面的方程称为特征方程:


该方程所有解的倒数称为该模型的特征根,如果所有的特征根的模都小于1,则该AR(p)序列是平稳的。

AR(p)模型的定阶

一般有两种方法来决定p:
第一种:利用偏相关函数(Partial Auto Correlation Function,PACF)
第二种:利用信息准则函数

偏相关函数判断p

对于偏相关函数的介绍,这里不详细展开,重点介绍一个性质:
AR(p)序列的样本偏相关函数是p步截尾的。
所谓截尾,就是快速收敛应该是快速的降到几乎为0或者在置信区间以内。

信息准则— AIC、BIC、HQ

现在有以上这么多可供选择的模型,我们通常采用AIC法则。我们知道:增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(Overfitting)的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。不仅仅包括AIC准则,目前选择模型常用如下准则:

  • AIC=-2ln(L)+2k 中文名字:赤池信息量 akaike information criterion
  • BIC=-2ln(L)+ln(n)*k 中文名字:贝叶斯信息量 bayesian information criterion
  • HQ=-2ln(L)+ln(ln(n))*k hannan-quinn criterion

模型的检验

根据式2.0,如果模型是充分的,其残差序列应该是白噪声,根据我们之前介绍的混成检验,可以用来检验残差与白噪声的接近程度。

拟合优度及预测

拟合优度

我们使用下面的统计量来衡量拟合优度:

但是,对于一个给定的数据集,R2是用参数个数的非降函数,为了克服该缺点,推荐使用调整后的R2:

它的值在0-1之间,越接近1,拟合效果越好。

预测

我们首先得把原来的样本分为训练集和测试集,再来看预测效果。

参考:https://uqer.io/v3/community/share/5790a091228e5b90cda2e2ea

猜你喜欢

转载自blog.csdn.net/my_learning_road/article/details/81191215