金融风控:通过率与坏账率的博弈

查准率与查全率

在机器学习领域,有两个常用的指标:查准率与查全率。

它们分别代表什么含义呢?让我们以一个例子来说明。

假设有400人申请贷款,已知其中有160人是好人。我们建立一个模型进行训练,训练的结果是把100个人识别成了好人。但是,实际上,这些人中间只有80人是真正的好人,另外20人是漏网之鱼。

其中,查准率(precision)=检出相关信息量/检出信息总量=80/100=80%

查全率(recall)=检出相关信息量/系统中的相关信息总量=80/160=50%

由此看来,查准率与查全率是一对相互矛盾的概念。

通常,要提高查准率,就要把标准定得严格一些,那么,就会有更多的人被识别为“坏人”,只有少数特别好的人才会被认为是“好人”。

这样,检出的好人数量一定会减少,那么在全部好人中的占比就会下降,也就直接导致查全率降低。

如果反过来,把标准定得低一些,虽然有更多的好人被识别为“好人”,查全率显著升高,可是也会有更多的坏人被误判为“好人”,导致查准率下降。

通过率和坏账率

在金融风控领域,有两个指标是与查准率和查全率相对的,即通过率和坏账率。它们表达的意思一致,但是具体含义不同。

坏账率指的是在被判断为好人的人群中,坏人所占的比例。即:

坏账率=年坏账率/年赊销总额=20/100=20%

因此,查准率=1 - 坏账率

这两个指标可以从正反两个方面来考察同一个含义。

通过率指的是在模型中被判断为好人的人占人群总数的比例,即:

通过率=100/400=25%。

为什么业内很少用查全率,而是常用通过率这个概念呢?

这是因为,在真实业务中,我们拒绝的那一部分申请人中,具体有多少是好人,我们是不清楚的,所以我们无法计算查全率。由于训练模型时使用的数据结果是已知的,因此我们可以在模型训练时使用。

通过率则可以直接度量、简单易算。从表达的含义上讲,通过率与查全率的衡量目标是一致的。

评价风控的指标是什么呢?

对于金融公司的风控能力,外行往往只谈论“坏账率”这一个指标,很少去关心它的“通过率”。特别是理财人士,往往希望金融公司的坏账率为零,让自己遭受损失的风险变得最小。但从内控方面来讲,风控部门也很希望可以降低“坏账率”,这体现着他们的风控能力,而且他们的收入往往也跟坏账率挂钩。

但是,如果想让坏账率降低,就需要把通过率控制在一定范围内,那么金融公司均摊到单个成交客户上的运营成本就增加了。在真实的业务中,获取客户和审核客户的成本都很高,如果不能成交,这些成本就付之一炬了。而且,业务人员的绩效考核往往以成交量作为度量。所以,业务人员更希望提高通过率。

另外,通过率的高低会直接影响用户体验。试想一下,如果申贷被拒绝的概率很高,那么用户体验就很差,如果通过率很高,往往意味着风控能力较弱,欺诈分子就会蜂拥而至,坏账率也会急剧提高。

因此,通过率和坏账率这一对矛盾的指标,是金融公司业务部门与风控部门之间的抗衡,也是金融公司在增长业绩与规避损失之间的博弈。权衡之下,金融公司往往会在两者之间取一个平衡,即在控制坏账率的前提下,争取更高的通过率,或者在保证通过率的前提下,让坏账率尽可能降低。

相关文章:

基于个人信用评分的建模分析和授信决策

信贷风控——贷前+贷中+贷后的全方位风控

数字金融反欺诈技术名词表

数字金融欺诈行为名词表

猜你喜欢

转载自blog.csdn.net/hajk2017/article/details/81172377