分类问题评估度量标准

1、错误率         E(f:D) = \frac{1}{m}\sum_{i=1}^{m}I(f(x_{i})\neq y_{i}))

预判错误的概率

2、精度          ACC(f:D) = \frac{1}{m}\sum_{i=1}^{m}I(f(x_{i})= y_{i}))=1-E(f ; D)

判断正确的概率

3、二分类混淆矩阵

预测的结果和真实的结果分成四类:

查准率(准确率) P (precision) =  \tfrac{TP}{TP+FP}      TP+FP:预测为正的 样本

查全率(召回率) R (recall)=  \tfrac{TP}{TP+FN}       TP+FN: 真正的 全部正样本

F1 值:

F1 = \frac{2\times P\times R}{P+R}            也是一种几何平均        \frac{2}{\frac{1}{P}+\frac{1}{R}}

Fβ 值:

Fβ = \frac{(1+\beta ^{2})\times P\times R}{(\beta ^{2}\times P)+R}          β < 1:准确率有更大影响        β>1:召回率有更大影响

4、ROC曲线和AUC (Area Under Curve)

纵坐标 TPR = \frac{TP}{TP+FN}     预测正确在真正的正样本中的概率

横坐标 FPR = \frac{FP}{TN+FP}     预测错误在真正的负样本中的概率

按预测结果按照顺序逐个样本预测画出ROC曲线。

AUC就是曲线下的面积,面积越大,分类效果越好

发布了28 篇原创文章 · 获赞 2 · 访问量 1016

猜你喜欢

转载自blog.csdn.net/sinat_36118365/article/details/101604281