数据挖掘竞赛

数据挖掘评估性能度量

对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure).

回归任务性能度量

在预测任务中,给定样例集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } D=\{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\} ,其中y是示例x的真实标记.要评估学习其的性能,就要把学习器的预测结果f和真实标记y进行比较:

  1. 均方误差(mean squared error,MSE) 其计算公式为: E ( f ; D ) = 1 / m m = 1 m ( f ( x i ) y i ) E(f;D) =1/m*{\sum_{m=1}^m}(f(x_i)-y_i)
    一般形式: E ( f ; D ) = ( f ( x ) y ) 2 p ( x ) E(f;D) = \int(f(x) - y)^2p(x)
  2. 平均绝对误差(Mean Absolute Error,MAE) :平均绝对误差,其能更好地反映预测值与真实值误差的实际情况,其计算公式如下: E ( f ; D ) = 1 / m m = 1 m f ( x i ) y i E(f;D) = 1/m * {{\sum_{m=1}^m}|f(x_i) - y_i|}
  3. R2(R-Square)的公式为残差平方和: S S r e s = m = 1 m ( f ( x i ) y i ) 2 SS_{res} = {{\sum_{m=1}^m}(f(x_i)-y_i)^2}
    总平均值: S S t o t = m = 1 m ( f ( x i ) y m e a n ) 2 SS_{tot}= {{\sum_{m=1}^m}(f(x_i) - y_{mean} )^2}
    其中y_mean表示y的平均值得到表达式为:
    R 2 = 1 S S r e s S S t o t R^2 = 1 - \frac{ SS_{res}}{SS_{tot}}
    R2用于度量因变量的变异中可由自变量解释部分所占的比例,取值范围是 0~1, 越接近1,表明回归平方和占总平方和的比例越大,回归线与各观测点越接近,用x的变化来解释y值变化的部分就越多,回归的拟合程度就越好。所以 也称为拟合优度(Goodness of Fit)的统计量。
    yi表示真实值, f(xi)表示预测值, y_mean表示样本均值。得分越高拟合效果越好。

分类任务性能度量

1.错误率(error rate)与精度(accuracy) 这是分类任务中最常用的两种性能度量,既适用于二分类任务,也适用于多分类任务.错误率是分类错误的样本数占样本总数的比例.对样本D,分类错误率定义为:
E ( f ; D ) = 1 / m i = 1 m ( f ( x i ) = y i ) E(f;D) = 1/m * {\sum_{i=1}^m}(f(x_i) \cancel= y_i )
精度定义为:
a c c ( f ; D ) = 1 / m i = 1 m ( f ( x i ) = y i ) acc(f;D) =1/m * {\sum_{i=1}^m}(f(x_i)=y_i)
= 1 E ( f ; D ) =1-E(f;D)

发布了4 篇原创文章 · 获赞 0 · 访问量 68

猜你喜欢

转载自blog.csdn.net/weixin_42295319/article/details/105080453
今日推荐