【科技金融】专家评分卡和机器学习评分卡的差异化和必要性

版权声明:文笔尽力通俗,讲得全,听得懂,学得会,用得上。觉得不错,留下小红心哟❤!!!( 转载请标明出处,谢谢!) https://blog.csdn.net/sunyaowu315/article/details/89488049

我们面临的问题

  最近发现,有不少做风控的小伙伴,脑子里有互金机器学习、数据分析的概念,但缺少整体做风控架构、系统、策略的思维,具体可以表现为对机器学习评分卡了如指掌,对专家评分模型却知之甚少。分析原因,大概是自己暂时没有坐到风控经理、总监的岗位上,没有掌握先从整体出发,再解决局部问题的思维能力。

  虽然现如今的科技金融讲求全自动、量化、大数据、无人工等概念要求,但我还是觉得,不同业态下的不同产品,面对着不同类型的用户,所需要的风控策略以及所用到的相关技术也会大有不同。如:

  • 线下大额业务风险低,风控侧重于线下市场团队的把握;
  • 线上大额业务风控侧重于个人消费能力和抵押品策略的有效制定;
  • 消费分期风控侧重于用户消费行为、用户画像的分析;
  • 现金贷风控则更注重用户的欺诈风险和还款意愿。

  就风控模型搭建而言,机器学习等技术,虽然有效可靠,但并不能完全满足我们对全链路风控弹性把握的需求,更不能做到绝对精准的预测。有的时候,我们需要切换思维,去思考所学,所思,所为,是否真正得到应用,且卓有成效? 知识(机器学习技术)和经验(专家经验)之间,又有怎样的差异化和有效性?

经验的重要性

  机器学习技术,本质上是利用统计学知识计算机科学帮助我们优化预测的准确性,而它的难点在于数据样本的选取和变量特征的筛选,特征筛选也基于所拥有的样本量和所选取的数据集。数据真实性、重复性、复杂度、有效性等都会影响到模型的结果。一旦数据有问题,分析人员又不完全熟悉整个数据处理的思路和流程,那模型的效果就会大打折扣。况且业务会随行业环境、政策要求、用户整体素质、产品形态调整等因素的改变而改变。

  总之,风控这行,我们不完全依赖于技术!要建立全域思维!

  对于算法和模型人员,也许花一个月时间用多种算法吭哧吭哧做了各种测试,辛辛苦苦将auc提高了5个点,却发现,它的效果远比不上轻轻松松引进的一个全新的业务特征。心里会很不是滋味,有口无言,然后怀疑数学这们学科艺术的价值。

  FICO之所以经典,就在于它根据金融行业经验和用户基本属性,用最简单的评价标准,做最简单的用户画像,设计简简单单的一些准入规则。剩下的,就是不断的优化迭代具体的风控策略、数据和模型了。这样的策略,既不会让业务理解起来很复杂,保证了用户体验,保证了风控模型的可解释性,也会将风险控制在合理的范围内。

  再从专家角度考虑下。专家之所以成为专家,局长之所以成为局长,就是因为现实中,影响一个事件结果的因素太复杂了,这些专家、局长就是经验的总成和代表。他们本身经过相关领域文化、知识、经验的多次、多层、长时间的训练和熏陶,自我已迭代出一套非常适应当下系统的策略和思考模型。本质上他们个人就是一个模型,准确性强,稳定性高,且权重系数极大,往往是我们底层职员的n倍,为何不用呢?

  • 领导的作用,在于把我们职员的劳动做归纳总结,向企业内外部做整体有效的输出,为什么不佩服呢?
  • 朋友的作用,在于将他多年来的所见所闻,以口传心授的方法转变为你自己的见闻,为什么不喜欢呢?
  • 书籍的作用,在于帮我们记录过去几千年历史文化知识的结晶,为什么不学呢?

  学习这回事儿,并不单单是自己啃书本,而是通过一切可以接触到的有效的途径去优化自己的行为。读书,交友,旅行,思考,试错,都是好方法。

拍脑袋策略

  所谓互金风控的拍脑袋策略,简单说就是业务经验与数据分析的总和,更多用于准入、反欺诈、授信的规则设计当中,多为一些你无法通过数据做合理解释,但确确实实认为它存在的那些业务变量。有很多规则只能通过经验来总结,因为数据有一个极大的弊端就是滞后性和局限性。

  举几个例子,当遇到下面的问题时,你的风控模型能做到提前预知、有效防范吗?

  如:

  或者:

  答案是几乎不可能。在经济学中有个理论:市场有效性假说。虽然这个理论很牛,但在内部市场和外部市场的共同作用中,或者类似经济危机爆发这类突然事件的发生,它的解释力度受到了非常大的局限性。【市场有效性】

  回到风控模型的搭建中,纯模型的思维,也不都是有效的。举几个栗子:

  ①我们对接了多头借贷信息。发现大部分用户1个月内小贷的申请次数分布在1~30次之间,次数越多,用户数越少,基本是一个幂律分布的形态;贷后分析结果为申请5次以内的用户逾期率最低,往高递增。如果用算法去做一个针对弱变量的模型,也许会有一定作用。但若从业务角度来讲,我们基本认为一个用户若是资质优秀,基本大量平台的风控都能通过,他也不需要借那么多钱。能够在短时间内申请30次以上借贷的,要么就是有极大借贷需求,要么就是闹着玩,要么就是纯撸贷的。这部分用户,即使不通过贷后表现去观察他们,也可以根据经验做出判断:高危群体(宁可误杀,也不放过),这就是所谓的专家经验。

  ②我们拿到了公检法的名单。暂时无法判断一个在法院失信却偏偏在其他借贷平台正常还款的用户的营销价值。由于该类用户样本量小,数据分析肯定会失真,那我们只能从经验上判断,通过几个类似的变量给这个客户打个标签,就是我们对这个客户信用的初步判断,可以作为把该类数据引入下一个模型深度加工的依据。

  ③我们拿到了多家三方的借贷信息。发现有些用户只在一家机构有逾期记录并且已经入黑,在其他机构还款都正常,我们不敢轻易放过他,但也不想错过,因为业务当中的流量、数据、风控、管理、合作等等,都是可见的成本。从规则的角度,大部分风控人员会拒绝该类用户;从模型的角度,样本量少到根本无法判断此类用户的逾期风险指标;那我们就可以从专家评分的角度出发,选几个与该变量类似但互为独立的变量,做加权,求总分,如10个变量,总分100,命中1家黑名单的权重系数为5,两次就为10,普通借贷还款记录权重为1~3,最终加权得到总分,就基本可以给这个客户做个简单的逾期风险评级,再做进一步决策。

  最后一个问题,专家怎么拍脑袋?那么多年的经验告诉他:有时候,老子说啥就是啥

代码编写思维

  既然是专家评分,肯定不能复杂,于是我们的思路就是设计简单的规则,然后加权求和。
在这里插入图片描述
在这里插入图片描述

怎么做才能更好

  系统 + 策略 + 规则 + 专家评分 + 量化模型,这是基本配置。之后,就是我们分析人员和模型人员根据业务发展,针对具体规则、数据、算法而作出的一次次辛勤的优化和迭代。

  在此,感谢大家(包括我自己)为中国科技金融整体的发展和推动所作出的付出和贡献,前方的路,我们还要走很久很久。

猜你喜欢

转载自blog.csdn.net/sunyaowu315/article/details/89488049
今日推荐