判定系数推导 — Coefficient of Determination Derivation

通过线性回归得到回归参数后,可以通过计算判定系数 R2 来评估回归函数的拟合优度。判定系数 R2 定义如下:

R2=SSRSST=1SSESST

其中, SSR=i=1n(ŷ iy¯i)2 SSE=i=1n(yiŷ i)2 SST=i=1n(yiy¯)2 R2 越接近1,回归函数的拟合优度越大。上式可改写成 SST=SSR+SSE ,即:
i=1n(yiy¯)2=i=1n(ŷ iy¯i)2+i=1n(yiŷ i)2

为了理解 R2 ,我们有必要先回顾一下线性回归的通式:

ŷ i=f(x)=θ0+j=1nθjxjiyi=ŷ i+ϵi

其中, yi 实际上由 ŷ i ϵi 组成, ŷ i xi 变化而变化。令 x0i=1 ŷ i=θ0+j=1nθjxji 可被改写成 ŷ i=θTxi 。将上式改写成向量和矩阵的形式:
111x11x12x1mx21x22x2mxn1xn2xnmθ0θ1θn=ŷ 1ŷ 2ŷ my1y2ym=ŷ 1ŷ 2ŷ m+ϵ1ϵ2ϵm

θ0 时, Ŷ  X 的一个线性组合,即 Ŷ  存在于由 X 的列向量所展开的列空间中。对于一次幂的线形回归, X 的列空间即是一个超平面, Ŷ  是存在于面内的一个向量(即 Y 在面上的投影)。为了使得残差最小化, ϵ Y 垂直于面方向上的投影。在三维中的几何意义如下图(文中 θ 即图中 β ,图中 Xi 表示列向量,图 取自):

因为 ϵ 垂直于 X 的列空间,所以 ϵ 垂直于 X 的所有列向量,即 XTϵ=0 。又因 ϵ=YXθ ,得:

XT(YXθ)=0XTY=XTXθθ=(XTX)1XTYŶ =Xθ=X(XTX)1XTY

根据 Ŷ =Xθ=X(XTX)1XTY ,我们得到了投影矩阵 P=X(XTX)1XT Ŷ =PY ,投影矩阵 P 乘以 Y 得到了 Y 属于 X 列空间的分量 Ŷ  。投影矩阵有两个性质需要了解:

  1. P 是对称矩阵;
    PT=(X(XTX)1XT)T=X((XTX)1)TXT=X((XTX)T)1XT=X(XTX)1XT=P
  2. P2=P
    P2=PTP=X(XTX)1XTX(XTX)1XT=X(XTX)1XTX(XTX)1XT=X(XTX)1XT=P

现在,我们可以开始推导判定系数公示 SST=SSR+SSE 了。如下( 1Rm ):

SST=i=1n(yiy¯)2=i=1n[(yiŷ i)+(ŷ iy¯)]2=i=1n(ŷ iy¯i)2+i=1n(yiŷ i)2+i=1n2(yiŷ i)(ŷ iy¯)=i=1n(ŷ iy¯i)2+i=1n(yiŷ i)2+i=1n2(yiŷ i)(ŷ iy¯)=i=1n(ŷ iy¯i)2+i=1n(yiŷ i)2+2ϵ(Ŷ Y¯1)=i=1n(ŷ iy¯i)2+i=1n(yiŷ i)2+2ϵ(PYY¯1)=i=1n(ŷ iy¯i)2+i=1n(yiŷ i)2+2ϵTŶ 2Y¯ϵT1

因为 ϵ 垂直于 X 的列空间,且 Ŷ  属于 X 的列空间,所以 ϵTŶ =0 ;又因为 1=x0iRm 1 属于 X 的列空间),所以 ϵT1=0 。因此:
SST=i=1n(ŷ iy¯i)2+i=1n(yiŷ i)2+2ϵTŶ 2Y¯ϵT1=SSR+SSE

猜你喜欢

转载自blog.csdn.net/u012841922/article/details/78691825
今日推荐