货款违约预测第二周周报

数据分析

  • 上次主要查看了数据的类型以及是否缺失,这次数据分析首先查看各个特征的基本统计量:

在这里插入图片描述

  • 知道了各个特征的一些基本统计量之后,先查找出数据中的对象特征和数值特征,再查看缺失数据的多少:
    在这里插入图片描述

  • 然后用一般的平均数来填充缺失值:
    在这里插入图片描述

  • 发现都已经填充完毕。
    在这里插入图片描述

  • 再用随机森林模型填补就业年限数字:
    在这里插入图片描述

  • 之后再对部分特征进行合并,以及对grade和subGrade进行手动编码:
    在这里插入图片描述

初步模型检验

  • 利用最原始的数据来进行检验:

    在这里插入图片描述

  • 可以得到一个最初的结果,当然后续还要进行一系列优化。

  • 以下是成绩截图:
    在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/zdxy921/article/details/108928540