我对于准确率---p值,召回率R值以及F值的理解

再互联网广告的推荐系统和反作弊的实践中经常遇到准确率,召回率,F值几个东西,刚入行的时候,我经常搞混,直到后来我逐渐明白了。
举个列子!

我们用一个模型去判断一段时间的作弊流量,假设该段时间的流量是100个,作弊的是25个,没有作弊的是75个,假设这里正样本为没有作弊的流量。
然后我们用lstm模型去预测,结果是70个没有作弊的,但是经检查,我们把其中69个正样本预测为没有作弊,把1个负样本预测为没有作弊

那么再我这个列子里面p=69/70(被预测为正样本且真的是正样本的数量/被预测为正样本的数量)
那么R=69/75(样本中的正例有多少个被预测正确了)

F值

可能很多人就会问了,有了召回率和准去率这俩个评价指标后,不就非常好了,为什么要有F值这个评价量的存在呢?


按照高中政治老师所说的,存在即合理的说法,既然F值存在了,那么一定有它存在的必要性,哈哈哈哈!


我们在评价的时候,当然是希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。


比如在我这个例子里就是这样,为此为了对模型的效果做一个综合的评价,所以才有了F值

F=(2*P*R)/P+R
其实这个公式我是记不住的,更多的时候你只需要会看调参页面就行了。

猜你喜欢

转载自blog.csdn.net/dongdouzin/article/details/79898407