多重共线性诊断与R语言实践 - 代码天地

多重共线性诊断与R语言实践

其他 2020-03-28 13:41:33 阅读次数: 0

鄙人学习笔记
参考文献：《计量经济学模型及R语言应用》-王斌会

文章目录

变量的多重共线性诊断

特征根分析法
条件数法
方差扩大因子法
直观判定法
举个例子(R语言)

变量的多重共线性诊断

多元线性回归模型的一个基本假设，就是要求自变量矩阵X列满秩，即秩rank(X)=p，也就是要求X的列向量之间线性无关。如果X的列不满秩，则(X’X)^-1将不存在，于是基于最小二乘回归系数估计，b = (X’X)^-1X’y将不存在，所以很难得出稳定的结果。

考虑线性回归模型：

这里假定自变量矩阵X已中心标准化，且rank(X)=p, 这时X’X/(n-1)为相关矩阵R。
下面给出几个常用的复共线性诊断方法。

特征根分析法

条件数法

方差扩大因子法

一般标准：
①当0<VIF≤5时，没有复共线性；
②当5<VIF≤10时，有较弱的复共线性；
③当10<VIF≤100时，有中等或较强的复共线性；
④当VIF>100时，有严重的复共线性。

由于VIF=1/TOL （TOL称为容忍度），所以也可以用TOL来诊断复共线性。

直观判定法

举个例子(R语言)

数据：

输入：

Xdf <- testdf[, -1]
Xscale <- scale(Xdf, T, T)
#scale(data, center=T,scale=T)
#1.center和scale默认为TRUE 
#2.center为TRUE 表示数据中心化 
#3.scale为TRUE 表示数据标准化
Rtest <- (t(as.matrix(Xscale)) %*% as.matrix(Xscale))/14
# * 是表示两个矩阵中对应的元素的乘积
# %*% 表示通常意义下的矩阵乘积，要求第一个矩阵的列数与第二个矩阵行数相等。
#相关矩阵 =  t(scale(X))*scale(X)/(n-1)
#备注：X为解释变量矩阵，维度是n*p；n为样本量
(Rtest)
(R01 <- cor(Xscale))
#查看我们自制的相关矩阵和R给出的相关矩阵是否一样

#1.特征分析法
(lamda = eigen(Rtest)$value)
#本次实验的相关系数矩阵最小特征根为0.1626082 >0.1 则不存在复共线性
#2.条件数法
(CN = max(lamda)/min(lamda))
#本次实验中CN = 11.53401，0<= CN <= 30, 则不存在多重共线性
#3.方差扩大因子法(VIF)
R2 <- summary(lm(x2 ~ x1 + x3, data = testdf))$r.sq
(VIF1 <- 1/(1 - R2))
#本次实验中VIF = 3.383924，0<= VIF <-5,同样没有复共线性

输出：

山羊菌

发布了116 篇原创文章 · 获赞 22 · 访问量 8万+

私信关注

猜你喜欢

转载自blog.csdn.net/m0_37422217/article/details/105060664

多重共线性诊断与R语言实践

多重共线性的诊断（R语言）

R语言之多重共线性的判别以及解决方法

Python 多重共线性检验

多重共线性的处理方法

04 聊聊线性回归多重共线性

回归分析中的多重共线性问题

多重共线性的解决方法

多重共线性+变量选择（钟老师）

回归分析----多重共线性【基础】

逻辑回归-建模后-多重共线性

数据分析——多重共线性检验

多重共线性全流程分析

【Python计量】多重共线性的检验和解决

多重共线性问题如何解决？

多重共线性产生原因及处理办法+R语言+糖尿病数据案例分析+逐步回归法

机器学习线性回归：谈谈多重共线性问题及相关算法

多重共线性问题的几种解决方法

多重共线性、异方差和自相关性

多重共线性检验-方差膨胀系数（VIF）

系统学习机器学习之特征工程（三）--多重共线性

逻辑回归中解决多重共线性问题

多重共线性——岭回归定义+岭迹分析+岭参数选择

去除多重共线性的5种方法，你学废了嘛？

Python统计学13——回归的多重共线性、异方差、自相关的检验

【机器学习笔记】：大话线性回归（三）多重共线性和强影响点分析

多重共线性检验-方差膨胀系数（VIF）-相关系数（机器学习）sklearn

回归分析的几个问题：异方差性、自相关性、多重共线性

回归模型中的多重共线性 + 危害 + 原因 + 判断标准 + 解决办法，回归系数

[DataAnalysis]多元线性回归深入浅出-案例+模型假设+参数估计方法+模型评判方法+变量选择+多重共线性问题

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)