随机森林之信贷风险模型特征工程 - 代码天地

随机森林之信贷风险模型特征工程

其他 2018-07-09 14:41:04 阅读次数: 0

信贷风险模型

今天在复习随机森林的时候，突然有了一些思考：信贷风险模型在我的理解，就是为了评估某个客户（企业，个体）在贷款等相关业务中，是否能够有效的将其贷款回收。通过自己的一些了解与猜想，信用评估模型中的主要评价来源是客户的数据。那么，数据可能会存在各种各样的数据，例如其历史借贷信息等。同时，收集的数据肯定会有很多的噪声。所以，如何根据这些特征信息来分析客户的借贷情况就显得尤为重要。

通常，在机器学习这里，我们都会构造一个合适的模型，从而根据数据来训练出一个比较合适的参数。这里，数据的特征构造对模型的性能会造成很大的影响。

所以，这里我就联想了到了再进行模型训练之前可以对数据进行一些操作，其中特征的选择就可以借鉴一下。下面，我主要介绍如何使用随机森林进行特征选择。

随机森林-特征重要性评价

这里，随机森林可以作为一种特征选择的工具来进行数据预处理。随机森林的主要思想可由下面这张图来说明：

主要的步骤有三步：

对于随机森林的每一颗决策树，使用响应的OOB(袋外数据)来计算袋外数据误差（Eroor_OOB1）
然后，在袋外数据OOB的所有样本中，对于某个样本特征X随机加入噪声干扰，相当于随机改变了样本在特征X处的值，再次计算袋外数据误差Error_OOB2
N棵树：

猜你喜欢

转载自blog.csdn.net/heart_leader/article/details/79480630

随机森林之信贷风险模型特征工程

信贷风险控制理论操作流程——特征工程、特征衍生

信贷风险指标

什么是信贷风险控制？

【大数据部落】基于决策树的银行信贷风险预警模型

风险控制：大数据与信贷风险管理

信贷违约风险预测（三）简单的特征工程

【科技金融】数字科技驱动的信贷风险技术

JAVA银行信贷风险控制系统

金融大数据应用-企业信贷风险防控模型竞赛开始-中国建设银行数据集-作者开箱测评

最新风控模型竞赛开始了，金融大数据应用-企业信贷风险防控-中国建设银行数据集

互联网金融公司在信贷风险管理方面，主要面临哪些挑战

特征工程-使用随机森林进行缺失值填补

随机森林特征选择

随机森林进行特征选择

打印随机森林模型

随机森林模型的原理

[转载]决策树模型组合之随机森林与GBDT

决策树模型组合之随机森林与GBDT

决策树模型组合之（在线）随机森林与GBDT

tensorflow基础模型之RandomForest（随机森林）算法

机器学习集成模型之随机森林_20201228

模型训练之决策树、随机森林、提升树

sklearn之随机森林

【代码模版】sklearn实现随机森林模型建立与特征重要性评估

R语言随机森林模型中具有相关特征的变量重要性

随机森林模型保存-python

随机森林模型及案例（Python）

使用随机森林计算特征重要度

随机森林的特征重要性原理

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)