(10)stata的基本使用--短面板数据处理

面板数据处理

数据描述

数据预览:
在这里插入图片描述
告诉计算机这是面板数据:
在这里插入图片描述
描述变量:
在这里插入图片描述
查看其他变量:
在这里插入图片描述
绘图:
在这里插入图片描述
在这里插入图片描述

混合回归

聚类稳健标准误

在这里插入图片描述
cluster后的变量表示聚类标准,表示使用以state变量聚类的聚类稳健标准误。

普通稳健标准误

在这里插入图片描述

对比普通稳健标准误与聚类稳健标准误(std.err),普通稳健标准误小于聚类稳健标准误。
但是,由于同一州不同时期之间的扰动项存在自相关,并且在使用普通稳健标准误时,默认扰动项微独立同分布,故普通稳健标准误的估计不准确。

固定效应

示例:

在这里插入图片描述
在这里插入图片描述

这一步我不知道在干啥???
在这里插入图片描述

使用固定效应模型还是混合回归模型呢?

在这里插入图片描述
示例:
在这里插入图片描述
最后一行,拒绝原假设(可以使用混合回归),认为使用固定效应要比混合回归好。但是由于未使用聚类标准误,因此这个F检验并不是最有效的,因为普通标准误仅有聚类标准误的一半。下面考虑LSDV方法。

LSDV法

在这里插入图片描述
截取了片段:
在这里插入图片描述

同样效果的操作:
在这里插入图片描述
上表可知,大多数个体虚拟变量是显著的,即存在个体效应,因此可以放心大胆地使用固定效应模型。

一阶差分法

在这里插入图片描述
示例:
我没做出来~,直接截取书中内容。
在这里插入图片描述

在这里插入图片描述

双向固定效应模型

介绍

在stata中生成时间虚拟变量
在这里插入图片描述
部分截图:
在这里插入图片描述
在这里插入图片描述

示例操作

在这里插入图片描述
year1是基期,故其效应由cons项所包含,year的效应均为负值,部分显著,部分不显著。那就检验一下联合显著性吧
在这里插入图片描述

显著不为零,也就是year是存在时间影响的。

直接生成双向时间效应模型(无需生成时间虚拟变量)

在这里插入图片描述

随机效应模型

介绍

在这里插入图片描述

FGLS操作

在这里插入图片描述
最后三行:
在这里插入图片描述

进行LM检验

在这里插入图片描述

检验结果:拒绝原假设(不存在个体随机效应模型),认为应该在随机效应模型与混合回归之间,我们选择随机效应模型。因为如下:

对随机效应模型进行MLE估计

在这里插入图片描述
随机效应MLE的系数估计值与随机效应FGLS的估计值不同,但在性质上相似。最后一行拒绝的原假设 σ u = 0 \sigma_u=0 σu=0,即认为存在个体随机效应,而拒绝混合回归模型。

选择固定效应还是随机效应,豪斯曼检验

方法

在这里插入图片描述

操作

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
由于P值小于0.05,故强烈拒绝原假设: u i 与 x i t , z i 不 相 关 u_i与x_{it},z_i不相关 uixit,zi故认为应该使用固定效应模型
*但是:重点来了,粘贴了,这点没懂~~~~~ *
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

组间估计

如果数据质量不好,可以考虑采用组间估计,但是会损失很多信息。
示例:
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_42830971/article/details/109330489