查准率、召回率、敏感性、特异性和F1-score的计算及Matlab实现


查准率(Precision):所有诊断为患病(1)样本中实际为患病的比率。

召回率(Recall):所有患病样本中被发现并诊断为患病的比率。

查准率 = TP/(TP+FP)

召回率 = TP/P = TP/(TP+FN)

敏感性 = TP/P = TP/(TP+FN)

特异性 = TN/N = TN/(TN+FP)

F1-Score = 2*Precision*Recall/(Precision+Recall)

可以利用CV集通过比较不同判断阈值得到的F1来判断用哪个阈值更好。


查准率、召回率、敏感性、特异性和F1-score的计算及Matlab实现:

%样本标记为0和1,num为选取前n个特征的数据用于分类
%需要安装好SVM
function [sens,spec,F1,pre,rec,acc] = SEERES(train,trainclass,test,testclass,num)
acc = zeros(num,1);
sens = zeros(num,1);
spec = zeros(num,1);
F1 = zeros(num,1);
pre = zeros(num,1);
rec = zeros(num,1);
FeatureNumber = zeros(num,1);
[len,b]=size(testclass);

for n=1:num
    label = trainclass;
    data = train(:,1:n);
    testlabel = testclass;
    testdata = test(:,1:n);
    model=svmtrain(label,data,'-s 0 -t 0 -b 1');%默认C-SVC类型,0 线性 2 RBF,-b会输出概率
    [predictlabel,accuracy,Scores]=svmpredict(testlabel,testdata,model,'-b 1');
    acc(n,1) = accuracy(1,1);
    FeatureNumber(n,1) = n;
    tp = 0;
    fn = 0;
    fp = 0;
    tn = 0;
    for y = 1:len
        if predictlabel(y,1)==1 && testclass(y,1)==1
            tp=tp+1;
        elseif predictlabel(y,1)==1 && testclass(y,1)==0
            fp=fp+1;
        elseif predictlabel(y,1)==0 && testclass(y,1)==1
            fn=fn+1;
        elseif predictlabel(y,1)==0 && testclass(y,1)==0
            tn=tn+1;
        end
    end
    sens(n,1) = tp/(tp+fn);
    spec(n,1) = tn/(tn+fp);
    pre(n,1) = tp/(tp+fp);
    rec(n,1) = sens(n,1);
    F1(n,1) = 2*(pre(n,1)*rec(n,1))/(pre(n,1)+rec(n,1));
end


H(θ) > 0.5       1类;

H(θ) <= 0.5     0类;

通过提升归为1类的阈值,如H(θ) > 0.7为1类,可以提高查准率,即诊断为患病时这个结果此时更可靠。 

通过降低归为1类的阈值,如H(θ) > 0.3为1类,可以提高召回率,即诊断为健康时这个结果此时更可靠。



猜你喜欢

转载自blog.csdn.net/mmm305658979/article/details/80118085