sklearn--分类器评估指标综述

sklearn.metric中性能的度量函数大体有四种
分类器性能指标
回归其性能指标
聚类器性能指标
两两距离测度
1.分类器性能指标
分类器的性能指标有很多,最常用的是三种
精度-召回率-F度量(precision-recall-F_measure)
在这里插入图片描述
损失函数(loss function)
在这里插入图片描述

除了图片上的指标外,还有
接收机操作曲线(receiver operating curves)
杰卡德相似系数(jaccard similarity coefficient)
MCC指标(相关性系数)

接收机操作曲线(ROC Curves)
1)只限于二元单标签分类问题的评估指标
matthews_corrcoef()-计算MCC系数(Matthews)
precision_recall_curve()-在不同概率阈值下计算精确度-召回的点集,形成曲线
roc_curve()-计算ROC曲线
2)二元多标签分类
average_precision_score()-计算预测得分的平均值
roc_auc_score()-计算预测得分的AUC值
3)用于多类分类问题的评估指标
cohen_kappa_score()
accuracy_score()
classification_report()
如何将二元分类拓展到多类或者多标签问题 ?
默认情况下只有正标签被用来计算指标,为了将这些指标扩展到多类,我们将多类视为二元分类的集合,并对数据集划分。同时计算这些子分类的二元指标,并将所有子分类问题上的得分平值平均起来,通常使用average。
5种处理权重的方法:macro,weighted,mirco,samples,average

猜你喜欢

转载自blog.csdn.net/soulproficiency/article/details/105490853