面板数据分析步骤及流程-R语言

1、首先确定解释变量和因变量;以index3为因变量,index1与index2为解释变量:

https://jingyan.baidu.com/article/bea41d43cd2307b4c51be624.html

https://blog.csdn.net/fanfanrenrenmi/article/details/52222728

2、单位根检验:数据平稳性 

为避免伪回归,确保结果的有效性,需对数据进行平稳性判断。

何为平稳,一般认为时间序列提出时间趋势和不变均值(截距)后,剩余序列为白噪声序列即零均值、同方差。

常用的单位根检验的办法有LLC检验和不同单位根的Fisher-ADF检验,若两种检验均拒绝存在单位根的原假设则认为序列为平稳的,反之不平稳。

xts(xi,t);adf.test

3、协整检验/模型修正 

单位根检验之后,变量间是同阶单整,可进行协整检验,协整检验是用来考察变量间的长期均衡关系的方法。

若通过协整检验,则说明变量间存在长期稳定的均衡关系,方程回归残差是平稳的,可进行回归。 

格兰杰因果检验:前提是变量间同阶协整,通过条件概率用以判断变量间因果关系。

granger.test

4、模型选择 面板数据模型;在这里选用豪斯曼(Hausman)检验。

plm.data(data,index=c())

plm( form=,data=,model='pooling')#混合

pooltest(个体、时间差异)

plm( form=,data=,model='within')#固定

pooltest(固定与混合比较)

phtest(form,data)#判断

#随机效应:

pbgtest(form=,data=,model='within')#LM检验

pwartest(检查序列相关 小则相关)

fixef(plm,effect='time')#时间对因变量影响

fixef(plm,effect='individual')#个体对因变量影响

面板数据模型的基本形式 

模型选择一般有三种形式 

(1)无个体影响的不变系数模型(混合估计模型)

(2)变截距模型(固定效用模型)

(3)变系数模型(随机效应模型)

选择合适的面板模型

F检验 

随机效应模型 

(1)LM检验

(2)豪斯曼(Hausman)检验。

form<- index3~index1+ index2
rankData<-plm.data(data,index=c("IPname","updatetime"))#转化为面板数据
pool <- plm(form,data=rankData,model="pooling")#混合模型
pooltest(form,data=rankData,effect="individual",model="within")#检验个体间是否有差异
pooltest(form,data=rankData,effect="time",model="within")#检验不同时间是否有差异
wi<-plm(form,data=rankData,effect="twoways",model="within")#存在两种效应的固定效应模型
pooltest(pool,wi)#F检验判断混合模型与固定效应模型比较
phtest(form,data=rankData)##Hausman检验判断应该采用何种模型,随机效应模型检验
pbgtest(form,data=rankData,model="within")#LM检验,随机效应模型检验
#检验是否存在序列相关
pwartest(form,data=rankData)#Wooldridge检验(自相关)小于0.05存在序列相关
summary(wi)##查看拟合模型信息
fixef(wi,effect="time")#不同时间对因变量的影响程度的系数估计值
inter<-fixef(wi,effect="individual")#不同个体对因变量的影响程度的截距估计值

##根据模型参数,进行预测;

 

Guess you like

Origin blog.csdn.net/weixin_42683052/article/details/108233599