线性模型选择与广义线性模型

线性模型选择

 

 

如何选择回归模型

当只了解一两种回归技术的时候,情况往往会比较简单。然而,当我们在应对问题时可供选择的方法越多,选择正确的那一个就越难。类似的情况下也发生在回归模型中。

掌握多种回归模型时,基于自变量和因变量的类型、数据的维数以及数据的其它基本特征去选择最合适的技术非常重要。以下是要选择正确的回归模型时需要考虑的主要因素:

1)数据探索是构建预测模型的不可或缺的部分。在选择合适的模型前,比如识别变量的关系和影响,应该首先执行这一步骤。

2)比较不同模型的拟合优点,我们可以分析不同的指标参数,如统计意义的参数,R-square,调整 R-square,AIC,BIC以及误差项,另一个是 Mallows’ Cp 准则。这个主要是通过将所选的模型与所有可能的子模型(或仔细挑选的一组模型)进行对比,检查可能出现的偏差。

3)交叉验证是评估预测模型最好的方法。使用该方法,需将数据集分成两份(一份用于训练,一份用于验证)。使用观测值和预测值之间的均方差即可快速衡量预测精度。

4)如果数据集中存在是多个混合变量,那就不应选择自动模型选择方法,因为我们并不愿意将所有变量同时放在同一个模型中。

5)所选择的回归技术也取决于你的目的。可能会出现这样的情况,一个不太强大的模型与具有高度统计学意义的模型相比,更易于实现。

6) 回归正则化方法(套索,岭和ElasticNet)在高维数据和数据集变量之间存在多重共线性的情况下运行良好。

广义线性模型理解:

https://blog.csdn.net/kMD8d5R/article/details/80863161

http://blog.csdn.net/lilanfeng1991/article/details/36185739

https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247484509&idx=1&sn=6f058f8add6c3f058c9c2732493c066e&chksm=e9e20dd6de9584c0a2c625d86033b822df31229f770dcdbd11ddf2a7851939a2bca2828a87bb&scene=21#wechat_redirect

猜你喜欢

转载自blog.csdn.net/rojyang/article/details/84765030