【示例】
设Y与有相关关系,一次回归模型,8组观测数据如下:
使用SAS中的REG过程来完成经典多元线性回归
基本语法
PROC REG data = 数据集;
MODEL 因变量 = 自变量列表 </可选项>;
< restrict 自变量的等式约束;>
SAS代码
data d1;
input x1-x3 y ;
cards;
38 47.5 23 66.0
41 21.3 17 43.0
34 36.5 21 36.0
35 18.0 14 23.0
31 29.5 11 27.0
34 14.2 9 14.0
29 21.0 4 12.0
32 10.0 8 7.6
;
proc reg data=d1;
model y=x1-x3 ;
run;
quit;
参数估计
所以回归方程:
参数估计表不仅给出回归方程的系数,还给出检验的结果(显著性概率p值)
比如给定, 若常数项和自变量的p值均a,意味着与回归方程高度显著产生矛盾,为了得到最优回归方程,应从方程中删除最不重要的自变量,重新建立与其余自变量的回归方程后再检验,这就涉及变量筛选的问题。
方差分析
回归平方和:
残差平方和:
平方和分解式:
均方误差:
均方误差是模型中误差方差的估计
检验统计量,显著性概率p值为,这表示拟合的模型是高度显著的,该模型解释了这组数据总变差中的主要部分。
回归统计量
决定系数:
复相关系数:
标准差的估计量: