1.多元线性回归
多元线性回归的代码实现如下:
> data3.1<-read.csv("C:/Users/Administrator/Desktop/data3.1.csv",head=TRUE)
> lm3.1<-lm(y~x1+x2+x3+x4+x5+x6+x7+x8+x9,data=data3.1)
> summary(lm3.1)
输出结果为:
因而
对9个自变量的线性回归方程为:
由summary()语句的输出结果可以看出,其中
值为
,对应的
值为
,由此可知次回归方程整体上高度显著,即做出9个自变量整体对因变量
产生显著线性影响的判断所犯错误的概率约为0.
2.方差分析
对于线性回归的方差分析,R语言中不仅可使用函数anova()得到方差分析表,还可以使用函数Anova()。
> library(car)
> Anova(lm3.1,type="III")
得到结果如下:
从上述结果中看出,在显著性水平
下,只有
对
产生显著线性影响。
3.偏相关系数
偏相关系数测定在回归方程中已包含若干个自变量时,在引入某一个新的自变量时, 的剩余变差的相对减少量,它衡量某自变量对 的变差减少的边际贡献。偏决定系数的算术平方根为片相关系数。
> data3.2<-read.csv("C:/Users/Administrator/Desktop/data3.2.csv",head=TRUE)
> lm3.2<-lm(y~x1+x2,data=data3.2)
> r<-cor(data3.2)
> library(corpcor)
> pcor3.2<-cor2pcor(r)
输出结果为:
相关系数:
偏相关系数:
从上面结果可以看出,
(
表示模型中已含有
时再加入
使
的剩余变差的相对减少量),
,进一步计算可得到偏决定系数
.
由相关系数矩阵可知,
与
的简单相关系数
,则决定系数
.
以上数据表明,用
与
做一元线性回归时,
能消除
的变差SST的比例是62.5%,再引入
时,
能消除剩余变差SSE的比例是54.6%,因而自变量
和
消除变差的总比例为
,这个值恰好是
对
和
的二元香型回归的决定系数
.