风控指标 —— KS

KS(Kolmogorov-Smirnov)读作 “柯尔莫哥洛夫-斯米尔诺夫”

part 1

原文作者:过一点画一条直线(知乎ID)
知乎专栏:数据化风控
原文链接:https://zhuanlan.zhihu.com/p/95797653

KS统计量是信用评分和其他很多学科中常见的统计量,在金融风控领域中,常用于衡量模型对正负样本的区分度。

通常来说,值越大,模型区分正负样本的能力越强,一般0.3以上,说明模型的效果比较好(申请评分卡)。

其定义如下:

K S = m a x { T P R − F P R } KS = max\{TPR - FPR\} KS=max{ TPRFPR}
在这里插入图片描述

与ROC曲线相似,ROC是以FPR作为横坐标,TPR作为纵坐标,通过改变不同阈值,从而得到ROC曲线。

而在KS曲线中,则是以阈值作为横坐标,以FPR和TPR作为纵坐标,KS曲线则为TPR-FPR,KS曲线的最大值通常为KS值。

当阈值减小时,TPR和FPR会同时减小,当阈值增大时,TPR和FPR会同时增大。而在实际工作中,我们希望TPR更大一些,FPR更小一些,即TPR-FPR越大越好。

在这里插入图片描述

K S KS KS R O C ROC ROC的关系

从上面的分析可知 K S = m a x ( T P R − F P R ) KS=max(TPR-FPR) KS=max(TPRFPR),因此当 K S KS KS最大的时候, T P R TPR TPR F P R FPR FPR 之间的差值最大。

第2幅图中的红线为ROC曲线,该曲线横轴坐标分别为 F P R FPR FPR T P R TPR TPR,图中黑线为 y = x y=x y=x,图中蓝线为 y = x y=x y=x 的平行线与ROC曲线的相交线,相交于A点。

因此,在A点时, T P R − F P R TPR-FPR TPRFPR取得最大值,对应于图上:
T P R = A B F P R = A C TPR = AB \\ FPR = AC TPR=ABFPR=ACKS 即为蓝色曲线的与Y轴的截距.

part 2

欢迎转载分享,请在文章中注明作者和原文链接,感谢您对知识的尊重和对本文的肯定。

原文作者:求是汪在路上(知乎ID)
原文链接:https://zhuanlan.zhihu.com/p/79934510/
⚠️著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处,侵权转载将追究相关责任。

KS的计算过程及业务分析

很多博客文章告诉我们,计算KS的常见方法是这样的:

step 1. 对变量进行分箱(binning),可以选择等频、等距,或者自定义距离。
step 2. 计算每个分箱区间的好账户数(goods)和坏账户数(bads)。
step 3. 计算每个分箱区间的累计好账户数占总好账户数比率(cum_good_rate)和累计坏账户数占总坏账户数比率(cum_bad_rate)。
step 4. 计算每个分箱区间累计坏账户占比与累计好账户占比差的绝对值,得到KS曲线。也就是: [公式]
step 5. 在这些绝对值中取最大值,得到此变量最终的KS值。

为帮助大家理解,现以具体数据(非业务数据)展示这一过程,如图2所示。其中,total是每个分数区间里的样本量,total_rate为样本量占比;bad代表逾期,bad_rate为每个分数区间里的坏样本占比。

在这里插入图片描述

图 2 - KS计算过程表
那么,分析这张表我们可以得到哪些信息呢?

模型分数越高,逾期率越低,代表是信用评分。因此,低分段bad rate相对于高分段更高, cum_bad_rate 曲线增长速率会比 cum_good_rate 更快,cum_bad_rate 曲线在 cum_good_rate 上方。

每个分箱里的样本数基本相同,说明是等频分箱。分箱时需要考虑样本量是否满足统计意义。

若我们设定策略 cutoff 为0.65(低于这个值的用户预测为bad,将会被拒绝),查表可知低于 cutoff 的 cum_bad_rate 为82.75%,那么将拒绝约82.75%的坏账户。

根据bad_rate变化趋势,模型的排序性很好。如果是A卡(信用评分),那么对排序性要求就比较高,因为需要根据风险等级对用户风险定价。

模型的KS达到53.1%,区分度很强。这是设定cutoff为0.65时达到的最理想状态。实际中由于需权衡通过率与坏账率之间的关系,一般不会设置在理想值。因此,KS统计量是好坏距离或区分度的上限。

通常情况下,模型KS很少能达到52%,因此需要检验模型是否发生过拟合,或者数据信息泄漏 。

猜你喜欢

转载自blog.csdn.net/itnerd/article/details/108697963
ks
今日推荐