Pyspark+tensorflow-信用贷款数据分析实战(二)——业务理解

2.业务理解

根据什么指标(变量)预测客户是否会欠贷?
在这里插入图片描述

  • 建立客户的违约模型,就需要确定变量X对违约状态Y的影响以及之后用到预测,这种根据属性,状态,行为来构建变量,是很低效的。

  • 就算使用几千个几万个变量加上一定的算法构建出来了一个模型,这种模型是没有价值的

  • 所以要对违约这个业务情况进行分析:
    在这里插入图片描述

  • 违约收益:借了一万,打死不还钱,赚了1万

  • 违约成本:不还款就会有成本(征信,信用,名誉等等)

  • 违约临界点:交点

信用评级不需要关注违约收益,信用评级中每个人的违约成本是不一样的,所以重点就是找指标来反映违约成本

  • 审批前:得到借款后收益比成本高,还款意愿就会不足,就有可能违约。

    • 还款意愿不足是由于:故意不还款
  • 放贷后:如果经济条件恶化,还款能力就会不足,就有可能违约。

    • 还款能力不足是由于:1.欲望大于能力2.没有稳定工作3.生活状态不稳定
  • 上述的这些理由肯定在数据表里面不会存储,需要通过一些存在在表中的变量来反映:

    扫描二维码关注公众号,回复: 15461077 查看本文章

比如:

  • 资产余额反映还款能力是否不足

  • 收支平衡反映欲望是否大于能力

  • 资产余额的波动率、平均资产余额、资产余额的变异系数反映生活状态是否稳定
    在这里插入图片描述
    如需数据:请添加QQ1240929749,备注:csdn数据

猜你喜欢

转载自blog.csdn.net/weixin_43676010/article/details/103778612