Python机器学习：corr()探索自变量与因变量的相关性 - 代码天地

Python机器学习：corr()探索自变量与因变量的相关性

企业开发 2023-04-08 21:09:55 阅读次数: 0

可以用相关矩阵corr()探索哪些变量与因变量是有强相关关系的，再用sort_values()将数据从大到小排序，并配合使用plot()对数据进行可视化，让结果更加直观。相关性弱的变量对模型的训练并没有帮助，因此可以把相关性弱的变量删除，只保留强相关的变量。

train.corr()['fraud_reported'].sort_values(ascending = False).plot(kind='bar')

代码讲解：

train是数据集；

train.corr()调用相关矩阵的函数，生成相关矩阵；

train.corr()['fraud_reported']筛选其中的一列，也就是自变量与因变量的相关关系所在的那一列；

sort_values()是排序函数，sort_values()里不加参数指的是从小到大排序；排序函数里面的ascending = False参数指从大到小排序；

plot()是折线图，plot(kind='bar')指柱状图；

对train数据集连续用了3个方法，分别是：①corr()生成相关矩阵；②把所需的字段fraud_reported筛选出来后，用sort_values()函数进行排序；③用plot()生成柱状图；

运行结果：

图太小了，可以用figure()函数调整画布大小：

import matplotlib.pyplot as plt
plt.figure(figsize=(15,8))

代码讲解：

plt是包名的简写，在前面有import过；

figsize里面的两个数字代表宽度和高度，这里设置宽15高8；

运行结果：

可以发现，age、policy_annual_premium等几个特征与因变量的相关系数几乎为0，说明对结果的影响很小，可以进行删除处理。

猜你喜欢

转载自blog.csdn.net/Sukey666666/article/details/128731319

Python机器学习：corr()探索自变量与因变量的相关性

如何使用python中的corr()求解变量之间的相关性？+pcolor的使用。

Python机器学习：corr()分析变量之间的相关关系

自变量/解释变量/因变量/响应变量/协变量等变量相关概念探析

python：df.corr() 数据的相关性分析

Pandas 计算相关性系数corr()方式_python

使用Matlab转换高阶方程自变量和因变量

生成特定相关性的数据，并增强变量之间的相关性 - Python编程实现

【机器学习】Python统计分析可视化库Seaborn(相关性图，变量分布图，箱线图等等)

变量相关性热力图

机器学习-线性回归2-python代码-房价预测-一维自变量

利用excel的formula_tracer直观显示函数的自变量因变量关系。

matlab三个自变量一个因变量拟合

数据可视化——变量相关性（基于MATLAB）

R平方/相关性取决于预测变量的方差

R语言20-变量相关性

ML之FE：机器学习算法/数据挖掘中特征选取(变量筛选)的简介、常用方法(单变量分析并筛选—Filter/Wrapper/Embedded、多变量间相关性分析并筛选—PCC/MIC/IV)之详细攻略

专利学习——一种基于变量相关性的多元时间序列相似性搜索方法

GEE python：各波段变量之间的相关性分析并绘制图（特征相关矩阵）

Python机器学习：自定义函数筛选相关性高的特征

机器学习基础知识之相关性分析

数字的自变量

[Python] 相关性分析

相关性学习笔记

随机变量的独立性和相关性

【时序模型】MATLAB实现特征变量相关性系数图和显著性检验

对用乘法法则求导及做数值微分的理解，以因变量是两项相乘（f*g）、自变量只有一元（x）为例。

TF之NN：基于TF利用NN算法实现根据三个自变量预测一个因变量的回归问题

NLP之【点互信息PMI】——衡量两变量之间的相关性

机器学习-随机性、概率论、多元统计、特征间的相关性

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)