R语言-用于非平衡数据集的一些度量指标

R语言-用于非平衡数据集的一些度量指标

鉴于已经有很多帖子详细介绍了度量分类器性能的各种指标,这里想跟大家分享笔者自己写的函数,函数将返回F_score(F度量,默认β取1),BACC(balanced accuracy),recall召回率, precision准确度,specifity真负率

代码如下:

#计算非平衡数据集的一些指标,主要输出F-score和BACC
#这里positiveclass和 negativeclass值是目标属性的值,如yes和no
UBMetrics<-function(preds, test.lable, positiveclass, negativeclass, bta=1){
  recall<-length(which(preds==test.label&preds==positiveclass))/length(which(test.label==positiveclass))
  
  precision<-length(which(preds==test.label&preds==positiveclass))/length(which(preds==positiveclass))
  
  specifity<-length(which(preds==test.label&preds==positiveclass))/length(which(test.label==positiveclass))
  
  F_score<-(1+bta^2)*precision*recall/(recall+precision)
  BACC<-(recall+specifity)/2
  
  return(c(F_score=F_score,BACC=BACC,recall=recall,precision=precision,specifity=specifity))
}

可将以上代码生成脚本任意命名,这里取名为UBMetrics,调用时参考:
source("D:\\workspace\\UBMetrics.R")

猜你喜欢

转载自blog.csdn.net/weixin_43545069/article/details/84789002
今日推荐