[转]R 模型评估

1、决定系数--复相关系数__R、决定系数__R方、校正决定系数__校正R方

    A、复相关系数__R:

            指的是多元回归系数,表示模型中y值与估计y值之间的相关系数,实际上是皮尔逊相关。

            

            R取值范围是[ 0,1 ],没有负值。R越大表明模型越好。但是R值多大算是最好,并没有定论,通常在社会学科中,R>0.4就算是足够好了;但是在科学领域,R>0.8才算可以。

    B、决定系数__R方:

            

            数学理解:分母理解为原始数据的离散程度,分子为预测数据和原始数据的误差,二者相除可以消除原始数据离散程度的影响;

            意义:描述自变量能够解释因变量的百分比,其值范围是[ 0 , 1 ],越接近1,解释效果越好

            缺点:随着自变量的增加,理论模型对因变量的解释准确性加强,R方不断接近1,因此提出校正R方;

    C、校正决定系数__校正R方:

           

               其中,n为样本数量,p为特征数量。即样本为n个[ x1, x2, x3, … , xp, y ]。

            策略: 尝试性通过(n-1)/(n-P-1)来尽力消除变量的增补对R方的影响;

猜你喜欢

转载自blog.csdn.net/scpcmoon/article/details/80553913