Probit模型、Logit模型、IV-Probit模型、IV-Probit模型

概述

Y = β 1 X 1 + β 2 X 2 + ϵ i Y=\beta_1X_1+\beta_2X_2+\epsilon_i Y=β1X1+β2X2+ϵi
边际效应:就是系数,即 β 1 \beta_1 β1 β 2 \beta_2 β2
解释:如,在控制其他变量(条件)不变的情况下,每增加一个单位的 X 1 X_1 X1 Y Y Y增加 β 1 \beta_1 β1 个单位。

Probit

模型:
在这里插入图片描述
它的边际效益推导:

Probit模型的边际效应可以通过计算变量对概率密度函数的一阶偏导数来获取。具体来说,对于一个二进制(0/1)的因变量 y y y,Probit模型可以表示为:

P ( y = 1 ∣ x ) = Φ ( β 0 + β 1 x 1 + ⋯ + β k x k ) P(y=1|x) = \Phi(\beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k) P(y=1∣x)=Φ(β0+β1x1++βkxk)

其中, Φ ( ) \Phi() Φ()是标准正态分布函数。则 x j x_j xj的边际效应为:

∂ P ( y = 1 ∣ x ) ∂ x j = ϕ ( β 0 + β 1 x 1 + ⋯ + β k x k ) ⋅ β j \frac{\partial P(y=1|x)}{\partial x_j} = \phi(\beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k)\cdot \beta_j xjP(y=1∣x)=ϕ(β0+β1x1++βkxk)βj

其中, ϕ ( ) \phi() ϕ()是标准正态分布的概率密度函数。这个结果告诉我们,边际效应是指当其他变量不变时,增加自变量 x j x_j xj一个单位对因变量的概率影响,即 β j \beta_j βj。需要注意的是,由于Probit模型是非线性的,所以边际效应可能会随着 x j x_j xj的变化而变化。
在这里插入图片描述
*表示展示所有的变量的边际取值
atmean在样本均值的边际效应
at(age=30)在特定值边际效应的取值

Logit

模型:
在这里插入图片描述

1、只做一次probit模型 
命令:probit y x1 x2,nolog 
mfx compute 
outreg2 using myfile, word replace(导出的是回归系数)
outreg2 using myfile, word mfx ctitle(mfx) append(导出的是边际效应,若不想要回归系数忽略上条命令)
2、做多次probit(因为我是分别加入控制变量和调节变量的,所以我做了两次probit)
probit y x1 x2,nolog 
mfx compute
outreg2 using myfile, word mfx ctitle(mfx) append
probit y x1 x2 x3 x4,nolog 
mfx compute
outreg2 using myfile, word mfx ctitle(mfx) append
注意每次做完probit回归都要做mfx命令和outreg2命令,最后结果就是多次probit的边际效应在一个表里

延伸阅读

这篇知乎文章写得很好
传送门-二元Logit模型和Probit模型及其Stata实现】作为笔记,码住

IV-Probit

这部分的模型延伸,其实最难的还是找IV,可以参是从地理因素、环境、气候等。
代码:在这里插入图片描述
y:被解释变量
age age_2 sex minzu hukou marry edu pary:控制变量
z:工具变量,可在后面加IV
x:核心解释变量

原理:
见文章:二值选择模型内生性检验方法、步骤及Stata应用

IV-Logit

在这里插入图片描述
在这里插入图片描述
从参考的文献来看,IV-Logit与Logit的区别就是引入工具变量的区别。

猜你喜欢

转载自blog.csdn.net/weixin_43213884/article/details/131072743
IV