参考链接:
1、https://blog.csdn.net/blueblood7/article/details/41823593
2、https://blog.csdn.net/lijiao1181491631/article/details/54407830?utm_source=blogxgwz0
3、https://blog.csdn.net/u014696921/article/details/74435229
1、混淆矩阵
预测 | 预测 | ||
---|---|---|---|
正 | 负 | ||
实际 | 正 | TP | FN |
实际 | 负 | FP | TN |
- TP:true positive,实际为正的,预测成正的个数
- FN:false negative,实际为正的,预测成负的个数
- FP:false positive,实际为负的,预测成正的个数
- TN:true negative,实际为负的,预测成负的个数
2、TPR/FPR/TNR/FNR
即上面提到的TP/FN/FP/TN的比率
-
TPR:true positive rate,真正率,敏感性sensitivity,实际为正的,预测成正的比率
-
FNR:false negative rate,假负率,实际为正的,预测成负的比率
-
FPR:false positive rate,假正率,实际为负的,预测成正的比率
-
TNR:true negative rate,真负率,特异性specificity,实际为负的,预测成负的比率数
3、ROC/AUC
ROC曲线:受试者工作特征曲线:receiver operating characteritic curve,又称为感受性曲线(sensitivity curve),表示敏感性和特异性之间的相互关系。
横坐标为FPR,纵坐标为TPR,如下图所示,ROC曲线上的每一个点对应一个threshold,
其中,有三种极限状态:
- TPR=0,FPR=0,这时threshold最大,将每个实例都预测为负类;
- TPR=1,FPR=1,这时threshold最小,将每个实例都预测为正类;
- TRP=1,FPR=0,理想模型,所有实例都预测准确。
一个好的分类模型,其曲线应该尽可能靠近上图的左上角。如果是随机猜测模型,则位于图中的主对角线上。
AUC:ROC曲线下方的面积,area under the ROC curve。另一种评价模型性能的方式,如果模型是完美的,则AUC=1,如果模型是随机猜测模型,则AUC=0.5,模型性能越好,则面积越大。
4、FAR/FRR/EER
人脸识别一般分为Indentification和Verification(人脸验证),当进行人脸验证时,一般考虑以下两个指标:
- 误识率(False Accept Rate,,FAR):将其他人误作指定人员的概率
- 拒识率(False Reject Rate,FRR):将指定人员误作其它人员的概率。
- 等错误率 (EER-Equal Error Rate) :取一组0到1之间的等差数列,分别作为识别模型的判别界限,既坐标x轴,画出FFR和FAR的坐标图,交点就是EER值。
一般,FAR=0.001时,FRR的值作为参考。值越小,性能越好。
计算机在判别时采用的阈值不同,这两个指标也不同。一般情况下,误识率FAR 随阈值的减小(放宽条件)而增大,拒识率FRR
随阈值的减小而减小。因此,可以采用等错误率(Equal Error Rate,
ERR)作为性能指标,即通过调节阈值,使这FAR和FRR两个指标相等时的FAR 或 FRR。
另一种关于FAR、FRR的解释如下:
5、FMR、FNMR
FMR:False match rate
FNMR:False non-match rate
错误采集率 failure-to-acquire rate FTA: 在辨识或验证的尝试中,采集不到样本或样本质量无法达到要求的比例。
6、GFAR、GFRR
GFAR :广义误接受率,Generalized false accept rate
GFRR :广义误拒绝率,Generalized false reject rate
广义上的错误拒绝发生在:
- 测试对象没有注册
- 不能提取提交的样本
- 存在错误匹配
广义上的错误接受和错误拒绝率将由下述公式给出:
FTE:注册失败率 failure-to-enroll rate