快速理解性能度量之精确率(查准率)和召回率(查全率)

如果是简单的二分类任务,分类出来的结果有四种,其中有可能出现两种错误的结果:
1.FP(False positive)本来是反例,模型将其预测为正例。

2.FN(False negative)本来是正例,模型将其预测为反例。

例如:如果我们认为患新冠为正例,没患新冠为反例。
有这么一个人,他本来是没患新冠的,结果核酸检测(模型)将其测为阳性,这就是一个FP。
有这么一个人,他本来是患新冠的,结果核酸检测(模型)将其测为阴性,这就是一个FN。

其实说到这里就可以发现了,在新冠肺炎检测这个场景下,FP肯定是要比FN要好一些的。

引入精确率(查准率)和召回率(查全率)

精 确 率 = T P T P + F P 精确率 = \frac{TP}{TP+FP} =TP+FPTP

召 回 率 = T P T P + F N 召回率 = \frac{TP}{TP+FN} =TP+FNTP

通过公式可以发现,如果想使精确率提升,那么FP越少越好。还是以核酸检测为例子,也就是说只要我检测出来是阳性的,我都希望他真的是阳性,这可以反映出我的检测能力。但众所周知,查准其实在疫情环境下用处不太大,查全才是最关键的(希望尽可能多的查找出阳性,误诊也没事)。

疑罪从无–查准率高
宁错抓一千,不放过一个–查全率高

猜你喜欢

转载自blog.csdn.net/xiufan1/article/details/127953962