工作中用到多分类评估,这里将用到的东西记录一下
1.通过sklearn.metrics模块可以计算许多常用的评估指标
partA
1. accuracy
accuracy_score(y_tru,y_pre)
预测正确的样本数/所有样本数
2.precision
precision_score(y_tru,y_pre,average = None)
此时返回所有类别的查准率构成的数组,平均方式还可以选择micro,macro等
3.recall
recall_score(y_tru,y_pre,average = None)
4.f1
f1_score(y_tru,y_pre,average = None)
partB
对于多分类问题,上述指标有以下平均方式
宏平均(Macro-averaging)和微平均(Micro-averaging)
宏平均(Macro-averaging),是先对每一个类统计指标值,然后在对所有类求算术平均值。(没有考虑到样本类别不平衡问题)
(5)
(6)
(7)
(8)
微平均(Micro-averaging),是对数据集中的每一个实例不分类别进行统计建立全局混淆矩阵,然后计算相应指标。
(9)
(10)
(11)