二元离散选择模型的建立
建立模型:
Yi=Xiβ+μi
二元选择下,
Yi=0,1。
E(μi)=0,所以
E(Yi)=
Xiβ。
易知
E(Yi)=P(Yi=1)=Xiβ。
P(Yi=1)要求[0,1]范围,而
Xiβ却没有这个限制,所以产生了矛盾。另外,
μi={1−Xiβ,当Yi=1,其概率为Xiβ−Xiβ,当Yi=0,其概率为1−Xiβ
为了使模型可以估计,建立
Yi∗=Xiβ+μi∗(1)
使得
P(Yi=1)=P(Yi∗>0)=P(μi∗>−Xiβ)(2)
为
μi∗选择的概率分布常用的是标准正态分布和逻辑分布,相应地形成了两种最常用的二元选择模型——Probit模型与Logit模型。
这两种分布都是对称的,所以
P(Yi=1)=P(Yi∗>0)=P(μi∗>−Xiβ)=1−P(μi∗≤−Xiβ)=1−F(−Xiβ)=F(Xiβ)
模型(1)的似然函数:
P(Y1,...,Yn)=Yi=0∏[1−F(Xiβ)]Yi=1∏F(Xiβ)
即
L=i=1∏n[F(Xiβ)]Yi[1−F(Xiβ)]1−Yi
取对数:
lnL=∑{YilnF(Xiβ)+(1−Yi)ln[1−F(Xiβ)]}
一阶条件为
∂β∂lnL=∑[FiYifi+(1−Yi)1−Fi−fi]Xi=0(3)
求解该方程组,可以得到模型参数估计量。
二元Probit模型
Probit模型就是
μi∗取正态分布推导得出的。
- 重复观测值不可得到时的情况
这个情况是指对每个决策者只有一个观测值。
在这种情况下我们将一阶条件(3)写为:
∂β∂lnL=Yi=0∑1−Fi−fi+yi=1∑FifiXi=i=1∑n[F(qiXiβ)qif(qiXiβ)]Xi=i=1∑nλiXi=0
其中
qi=2Yi−1
上式关于
β式非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。
- 重复观测可以得到时的情况
由于外部条件不变很难实现,所以这个模型的应用价值受到限制。
二元Logit模型
就是方程(2)中的
μi∗的概率分布设为逻辑分布而推导得到的。
逻辑分布的分布函数:
F(t)=1+e−t1
密度函数:
f(t)=(1+e−t)2e−t
其中分布函数可改写为:
F(t)=1+etet=Λ(t)(4)
概率密度函数可改写为:
f(t)=(1+et)2et=Λ(t)[1−Λ(t)](5)
- 重复观测值不可得到时的情况
将(4)(5)代入一阶条件(3)中:
∂β∂lnL=∑[FiYifi+(1−Yi)1−Fi−fi]Xi=i=1∑n[Yi−Λ(Xiβ)]Xi=0
上式关于
β非线性,不能直接求解,需采用完全信息最大似然法中的迭代方法。
- 重复观测值可以得到的情况
同样可以采用广义最小二乘法估计二元Logit模型。