相关系数与相关指数区别

一、有关叫法

相关系数包括:简单相关系数、复相关系数、偏相关系数、典型相关系数 ;
相关指数又叫做决定系数、判定系数、拟合优度。

二、相关系数

2.1 概念

由于研究对象的不同,相关系数的定义也有所不同:

2.1.1 简单相关系数

简单相关系数:又叫相关系数或线性相关系数,一般用字母r表示,描述自变量和因变量的线性相关程度

  • 当r大于0时,表明两个变量正相关,r小于0时,表明两个变量负相关;
  • r的绝对值越接近于1时,表明两个变量的线性相关性越强;
  • r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系;
  • 通常|r|大于0.75时,认为两个变量有很强的线性相关性。

2.1.2 复相关系数

复相关系数:又叫多重相关系数,一般用字母R来表示。复相关系数是反映一个因变量与一组自变量(两个或两个以上)之间相关程度的指标。它不能直接测算,只能采取一定的方法进行间接测算。(具体可参考:https://wiki.mbalib.com/wiki/%E5%A4%8D%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0)

2.1.3 偏相关系数

偏相关系数:又叫部分相关系数,反映校正其它变量后某一变量与另一变量的相关关系,校正的意思可以理解为假定其它变量都取值为均数。 偏相关系数的假设检验等同于偏回归系数的t检验。 复相关系数的假设检验等同于回归方程的方差分析。

2.1.4 典型相关系数

典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。

2.1.5 相关指数

描述回归模型的回归效果

  • R 2 R^{2} R2越大,确定的回归模型的拟合效果越好, R 2 R^{2} R2越小,模型的拟合效果越差;
  • R 2 R^{2} R2越接近于1,表示拟合效果越好;
  • 在实际中,我们应该尽量选择 R 2 R^{2} R2大的回归模型

2.2 计算公式

2.2.1 简单相关系数

r ( X , Y ) = Cov ⁡ ( X , Y ) Var ⁡ [ X ] Var ⁡ [ Y ] = E [ ( X − E X ) ( Y − E Y ) ] E [ X − E X ] 2 E [ Y − E Y ] 2 = ∑ i = 1 n ( x i − x ‾ ) ( y i − y ‾ ) ∑ i = 1 n ( x i − x ‾ ) 2 ∑ i = 1 n ( y i − y ‾ ) 2 = ∑ i = 1 n x i y i − n x ‾ y ‾ ( ∑ i = 1 n x i 2 − n x ‾ 2 ) ( ∑ i = 1 n y i 2 − n y ‾ 2 ) \begin{aligned} r(X, Y)&=\frac{\operatorname{Cov}(X, Y)}{\sqrt{\operatorname{Var}[X] \operatorname{Var}[Y]}}=\frac{\mathrm{E}[(X-\mathrm{EX})(Y-\mathrm{EY})]}{\sqrt{\mathrm{E}[X-\mathrm{EX}]^{2}} \sqrt{\mathrm{E}[Y-\mathrm{EY}]^{2}}}\\ &=\frac{\sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)\left(y_{i}-\overline{y}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2} \sum_{i=1}^{n}\left(y_{i}-\overline{y}\right)^{2}}}\\ &=\frac{\sum_{i=1}^{n} x_{i} y_{i}-n \overline{x} \overline{y}}{\sqrt{\left(\sum_{i=1}^{n} x_{i}^{2}-n \overline{x}^{2}\right)\left(\sum_{i=1}^{n} y_{i}^{2}-n \overline{y}^{2}\right)}} \end{aligned} r(X,Y)=Var[X]Var[Y] Cov(X,Y)=E[XEX]2 E[YEY]2 E[(XEX)(YEY)]=i=1n(xix)2i=1n(yiy)2 i=1n(xix)(yiy)=(i=1nxi2nx2)(i=1nyi2ny2) i=1nxiyinxy

2.2.2 复相关系数

R = ∑ ( y − y ‾ ) ( y ^ − y ‾ ) ∑ ( y − y ‾ ) 2 ∑ ( y ^ − y ‾ ) 2 0 ≤ R ≤ 1 R=\frac{\sum(y-\overline{y})(\hat{y}-\overline{y})}{\sqrt{\sum(y-\overline{y})^{2} \sum(\hat{y}-\overline{y})^{2}}} \quad 0 \leq R \leq 1 R=(yy)2(y^y)2 (yy)(y^y)0R1

2.2.3 偏相关系数

2.2.4 典型相关系数

2.2.5 相关指数

R 2 = S S R S S T = ( 1 − S S E S S T ) = 1 − ∑ i = 1 n ( y i − y ^ i ) 2 ∑ i = 1 n ( y i − y ‾ ) 2 \begin{aligned} R^{2}&=\frac{S S R}{S S T}=\left(1-\frac{S S E}{S S T}\right)\\ &=1-\frac{\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}{\sum_{i=1}^{n}\left(y_{i}-\overline{y}\right)^{2}} \end{aligned} R2=SSTSSR=(1SSTSSE)=1i=1n(yiy)2i=1n(yiy^i)2
回归平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)

残差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)

总离差平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)

相关参考:https://blog.csdn.net/snowdroptulip/article/details/79022532

猜你喜欢

转载自blog.csdn.net/ch206265/article/details/89304473