多元回归与相关------(二)多元相关和偏相关

在 M=m+1 个变数中,m个变数的综合和一个变数的相关,叫做多元相关或负相关(multiple correlation);

其余M-2个变数皆固定时,指定的两个变数间相关,叫做偏相关(partial correalation)

从相关关系的性质看,多元相关和偏相关的M个变数都是随机变数,并无自变数和依变数之分。

多元相关和偏相关的统计数也常用于有自变数和依变数之分的资料,并作为回归显著性的一个指标。

一、多元相关

多元相关分析师计算多元相关系数并测验其显著性。

(1)多元相关系数

在m个变数和1个变数的多元相关中,多元相关系数记作 R_{y\cdot 12...m},读作y和m个变数的多元相关系数。

m个自变数对y的回归平方和为U_{y/ 12...m},U_{y/ 12...m}占y的总平方和SS_{y}的比率愈大,表明y和m个自变数的多元相关愈密切,可定义:

                R_{y\cdot 12...m}=\sqrt{\frac{U_{y/ 12...m}}{SS_{y}}}=\sqrt{1-\frac{Q_{y/ 12...m}}{SS_{y}}}

R_{y\cdot 12...m} \in [0,1],在一定自由度下,R_{y\cdot 12...m}的值愈接近1,多元相关愈密切;R_{y\cdot 12...m}的值愈接近0,多元相关愈不密切 。

因为多元回归的平方和一定大于任一自变数对y的回归平方和,故多元相关系数一定大于任一自变数对y的简单相关系数的绝对值大。

(2)多元相关系数的假设测验

令总体的多元相关系数为 \rho ,则对多元相关系数的假设测验 H_{0}:\rho =0  对   H_{A}:\rho \neq 0F测验:

                 F=\frac{\nu_{2}R^{2}}{\nu _{1}(1-R^{2})}              \nu _{1}=m,\nu _{2}=n-(m+1)    R^{2} 为 R_{y\cdot 12...m} 的缩写

多元相关系数的假设测验和多元回归方程的假设测验是等价的。

\nu _{1} 、 \nu _{2}一定时,给定显著水平 \alpha 下的F值一定,可计算显著水平 \alpha 时的临界 R 值:

                R_{\alpha }=\frac{\nu_{1}F_{\alpha }}{\nu_{1}F_{\alpha }+\nu _{2}}

二、偏相关:计算偏相关系数并测验其显著性

(1)偏相关系数

偏回归系数是在其他m-1个自变数都保持一定时,指定的某一自变数对于对于依变数y的效用;

偏相关系数则表示在其它M-2个变数都保持一定时,指定的两个变数间相关的密切程度。

偏相关系数是以r带右下标表示。若有 X_{1}X_{2}X_{3} 3个变数,则 r_{12\cdot 3} 表示 X_{3}变数保持一定时,X_{1}X_{2}变数的偏相关系数;

 r_{13\cdot 2} 表示 X_{2}变数保持一定时,X_{1}X_{3}变数的偏相关系数; r_{23\cdot 1} 表示 X_{1}变数保持一定时,X_{3}X_{2}变数的偏相关系数。

若有M个变数,则偏相关系数共有 M(M-1)/2 个。

在多个变数错综复杂的关系中,偏相关系数可帮助排除假象相关,找到真实联系最为密切的变数。

以上R中的主对角线元素r_{ii}为各个变数的自身相关系数,都等于1;

该矩阵以主对角线为轴而对称,即 r_{ij}=r_{ji} 。逆阵R^{-1}中的元素也是以主对角线为轴对称的,即{c}'_{ij}={c}'_{ji}

(2)偏相关系数的假设测验

偏相关系数 r_{ij} 的测验也需要通过转换进行。令总体偏相关系数 \rho _{ij},测验H_{0}:\rho_{ij} =0  对   H_{A}:\rho_{ij} \neq 0则:

t=\frac{r_{ij}\sqrt{n-M}}{1-r^{2}_{ij}}    \nu =n-M

r_{ij}=\sqrt{\frac{t^{2}}{\nu +t^{2}}}

(3)偏相关与简单相关的关系

偏相关和偏回归的方法分析时,消除了自变数相关的混淆,能够表现出自变数和依变数的单独关系。

简单相关包含有其他因素作用成分在内的相关与回归,主要研究目的是正确选用适当的统计指标。

               

猜你喜欢

转载自blog.csdn.net/mengjizhiyou/article/details/82252555