什么是外生变量和内生变量

python的计量经济学包statsmodels中使用endog和exog作为数据参数的变量名,即在估计问题中使用的观测变量。在不同的统计软件包或教科书中经常使用的其他名称,例如endog/exog被叫做因变量(dependent variable)/自变量(independent variable)、y/x、left hand side(LHS)/right hand side (RHS)、回归变数(regressand)/回归量(regressors)、outcome/design、响应变量/解释变量。

endog/exog本身也就是内生变量/外生变量的意思。内生性指的是由系统内部因素引起的,外生反之。也就是说,内生变量指的是在计量模型中,由该模型解释或预测的变量。外生变量指的是在计量模型中,没有被该模型解释的变量(模型需要让外部设定这些变量)。

在计量经济学和统计中,术语的定义更为正式,并根据模型使用不同的外生性定义(弱、强、严格)。在statsmodels中作为变量名的用法不能总是按照正式的意义来解释,但却试图遵循相同的原则。

在最简单的形式中,模型将观察到的变量y与另一组变量x以某种线性或非线性形式联系起来:

y = f(x, beta) + noise
y = x * beta + noise

然而,为了得到一个统计模型,我们需要对解释变量x和noise的属性做额外的假设。许多基本模型的一个标准假设是x与noise无关。在更一般的定义中,x外生意味着我们不必考虑x的解释变量是如何生成的——不管是design还是由一些潜在的随机分布生成。

不过这不代表外生变量的性质不需要在模型中考虑。我们仍然需要注意一些基本统计假设。例如,在误差或噪声项随时间独立分布(或随时间不相关)的条件下,最小二乘法中的exog可以有滞后因变量。但是,如果误差项是自相关的,那么OLS就没有很好的统计特性。此时,正确的模型是ARMAX。statsmodel具有用于回归诊断的功能,以测试某些假设是否合理。

猜你喜欢

转载自blog.csdn.net/FYZDMMCpp/article/details/106214460