Python数据挖掘实战——相关分析 - 代码天地

Python数据挖掘实战——相关分析

其他 2018-05-27 22:13:41 阅读次数: 0

继续补以前拉下的债~~~

一、相关性指标的研究意义
1.1相关系数（Correlation coefficient）：

相关系数是变量间关联程度的最基本测度之一

1.2相关分析（Correlation analysis）

是研究现象之间是否存在某种依存关系，并对具体有依存关系的现象探讨其相关方向以及相关程度，是研究随机变量之间的相关关系的一种统计方法。

二、相关系数的基本特征
2.1方向：
正相关（positive correlation）：两个变量变化方向相同

负相关（negative correlation）：两个变量变化方向相反

2.2量级（magnitude）：

低度相关：0≤| r | ≤ 0.3
中度相关：0.3≤| r | ≤ 0.8

高度相关：0.8≤| r | ≤ 1

散点分部在一条直线周围==>变量存在线性相关关系。

三、相关系数的计算

Zx = （每个变量中的值 - 该变量的均值）除以（标准差）

3.2案例实战：

四、代码案例：
4.1numpy案例：

import numpy

X = [
    12.5, 15.3, 23.2, 26.4, 33.5, 
    34.4, 39.4, 45.2, 55.4, 60.9
]
Y = [
    21.2, 23.9, 32.9, 34.1, 42.5, 
    43.2, 49.0, 52.8, 59.4, 63.5
]

#均值
XMean = numpy.mean(X);
YMean = numpy.mean(Y);

#标准差
XSD = numpy.std(X);
YSD = numpy.std(Y);

#z分数
ZX = (X-XMean)/XSD;
ZY = (Y-YMean)/YSD;

#相关系数
r = numpy.sum(ZX*ZY)/(len(X));

#直接调用Python的内置的相关系数的计算方法
numpy.corrcoef(X, Y)

4.2Pandas案例

import pandas;

X = [
    12.5, 15.3, 23.2, 26.4, 33.5, 
    34.4, 39.4, 45.2, 55.4, 60.9
]
Y = [
    21.2, 23.9, 32.9, 34.1, 42.5, 
    43.2, 49.0, 52.8, 59.4, 63.5
]

data = pandas.DataFrame({
    'X': X, 
    'Y': Y
})
data.corr()

？查看安斯库姆四重奏

猜你喜欢

转载自blog.csdn.net/zhuoyue65/article/details/80356646

Python数据挖掘实战——相关分析

python数据挖掘笔记——相关分析

学习python数据分析与挖掘实战

python数据分析与挖掘实战

Python数据分析与挖掘实战总结

python数据分析与挖掘实战（五）

python数据分析与挖掘实战（四）

python数据分析与挖掘实战（三）

【笔记】python数据分析与挖掘实战

《Python数据分析与挖掘实战》笔记（三）：数据探索

python数据分析与挖掘实战（数据探索）

python数据挖掘与分析

Python数据分析与挖掘实战第10章

Python数据分析与挖掘实战 14章

Python数据分析与挖掘实战 12章

Python数据分析与挖掘实战 15章

Python数据分析与挖掘实战 11章

Python数据分析与挖掘实战第9章

Python数据分析与挖掘实战 13章

Python数据分析与挖掘实战第8章

Python数据分析与挖掘实战第7章

Python数据分析与挖掘实战第6章

《Python数据分析与挖掘实战》pdf 附下载链接

python数据分析与挖掘实战逻辑回归代码勘误

Python3数据分析与挖掘建模实战视频

Python3数据分析与挖掘建模实战

Python3数据分析与挖掘实战

Python数据分析与挖掘实战 pdf下载

B31_Python数据分析与挖掘实战

Python数据分析与挖掘实战——第二章

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)