【R语言实验】R语言多元线性回归模型中变量的选择和诊断分析

实验目的:了解R语言多元线性回归模型中变量的选择和诊断分析
实验要求:对给出的数据用逐步回归的方法选择变量,并对实验结果进行诊断分析。
实验数据:1. 对给出数据进行变量选择,并进行回归诊断。
实验代码:

a1<-read.table('clipboard',header=T)
lm1<-lm(y~x1+x2+x3+x4,data=a1)
lm1.step<-step(lm1,direction='both')
summary(lm1.step)
y.res<-residuals(lm1)
y.rst<-rstandard(lm1.step)
y.rst
y.fit<-predict(lm1.step)
plot(y.res~y.fit)
plot(y.rst~y.fit)
lm1.step_new<-update(lm1.step,log(.)~.)
y.rst<-rstandard(lm1.step_new)
y.fit<-predict(lm1.step_new)
plot(y.rst~y.fit)
par(mfrow=c(2,2))
plot(lm1.step_new)
influence.measures(lm1.step_new)

实验结果分析:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可得到回归模型为,进行回归诊断,计算逐步回归模型的标准化残差,判断可能存在的异常点。从上图中可以看出,除13、14、31号观测值,残差-拟合图中的点基本上呈随机分布模式;正态Q-Q图中的点基本落在直线上,表明残差基本服从正态分布;大小-位置图和残差-杠杆图中第13、14、31号点偏离中心位置较远,这说明13、14、31号观测值可能是异常点或强影响点。
由诊断统计量可知,13、30、31号观测值被诊断为强影响点。

猜你喜欢

转载自blog.csdn.net/qq_44762986/article/details/113102659
今日推荐