Pyspark+tensorflow-信用贷款数据分析实战（三）——数据提取

企业开发 2023-06-25 07:22:13 阅读次数: 0

3.数据提取

目的：建立因果关系模型
数据提取的时候要对数据有一定的认识，不能是相关而应该是因果（区分相关关系和因果关系），预测的变量x要在被预测变量y之前取得

相关关系：一个小孩子身高的长高速度和GDP增长的速度就可以做相关关系，但这明显没有什么关系。

因果关系：家庭收入和全国GDP总量，这就明显具有一定的因果关系。
在这里插入图片描述
细分了特征变量之后，就有了下面的模型框架：

观察窗口（历史）看解释变量：

如果是静态变量可以任意提取因为不管它在历史还是未来都不变；
如果是时点变量可以提取放贷前（红蓝分界线）任意时间点的数据，例如余额，资产收入，资产支出等；
如果是区间变量可以提取放贷日前一年或者前两年的数据，例如平均账户余额，平均账户余额的增长率

这就模拟了放贷人员在放贷之前的审批准则（能够看到客户的）

预测窗口（未来）看被解释变量y：

是否拖欠贷款

观察窗口和预测窗口提取数据逻辑要符合实际情况，这样设计的窗口才能得到可用的有价值的模型。

例如：有些股票预测模型，买之前预测的很准，买之后准确率就下降了，这就是因为没有分清x是什么类型的变量，取的是所有时段的，导致预测与实际情况不符

如需数据：请添加QQ1240929749，备注：csdn数据

猜你喜欢

转载自blog.csdn.net/weixin_43676010/article/details/103778632

Pyspark+tensorflow-信用贷款数据分析实战（三）——数据提取

Pyspark+tensorflow-信用贷款数据分析实战（四）——提取数据代码

Pyspark+tensorflow-信用贷款数据分析实战（一）——了解数据

Pyspark+tensorflow-信用贷款数据分析实战（二）——业务理解

python数据分析实战——kiva贷款数据

LendingClub贷款数据分析

python数据分析 Lending Club贷款数据

python数据分析案例实战——融360客户贷款风险预测（信用卡）

R语言25-Prosper 贷款数据分析1

R语言26-Prosper 贷款数据分析2

R语言28-Prosper 贷款数据分析4

R语言27-Prosper 贷款数据分析3

学习退款数据分析思路

R语言与数据分析实战10-数据的提取

国美金融贷款数据预处理，国美金融贷款数据id处理

PySpark数据分析教程（转载）

Spark数据分析之pyspark

【Pyspark】常用数据分析基础操作

基于各国贷款数据的可视化分析（含python代码）

python数据分析与挖掘实战（三）

kaggle实战：极度不均衡的信用卡数据分析

分析数据的软件有哪些？这几款数据分析软件不用会后悔

R 语言贷款月供数据分析

数据分析：个人贷款违约案例（逻辑回归）

《Python数据分析与挖掘实战》笔记（三）：数据探索

数据分析（三）

数据分析(三)

关于企业贷款违约情况的数据分析研究的Python数据分析案例

国美金融贷款ABC+loT技术，国美金融贷款数据采集、链接

数据分析必备｜你不得不知道的11款数据分析工具

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)