(Pearson)皮尔逊相关系数和spearman相关系数（附python实现）

企业开发 2018-11-16 12:10:49 阅读次数: 0

今天在做数据分析的时候，发现了需要计算特征之间的相似度，从而在相似度比较高的特征之间保留一个就行。查了一下，发现可以通过皮尔逊相关系数和spearman相关系数来计算特征之间的相似度，下面将介绍这两个系数和区别。

皮尔逊相关系数

下面是皮尔逊相关系数的计算公式，只需要将（X和Y的协方差）/（X的标准差*Y的标准差）

在这里插入图片描述
可以化简成

spearman相关系数

在这里插入图片描述

简单的相关系数的分类

那么对于这两个系数，怎样的值才是好的呢，遵循下面的关系

0.8-1.0：极强相关
0.6-0.8：强相关
0.4-0.6：中等强度相关
0.2-0.4：弱相关
0.0-0.2：极弱或者无相关

区别

那么有个问题，是所有的变量都可以用这两个系数吗，这两个变量当然是有区别的，区别如下。

连续数据，正态分布，线性关系，用pearson相关系数是最恰当，当然用spearman相关系数也可以，效率没有pearson相关系数高。
上述任一条件不满足，就用spearman相关系数，不能用pearson相关系数。
两个定序测量数据（顺序变量）之间也用spearman相关系数，不能用pearson相关系数。

代码实现

import pandas as pd
data = loans_2007[["funded_amnt", "funded_amnt_inv"]]
#计算皮尔逊系数
print(data.corr())
#计算spearman系数
print(data.corr('spearman'))

这是结果，可以看出这两个变量的相关性还是很高的



                 funded_amnt  funded_amnt_inv
funded_amnt         1.000000         0.947525
funded_amnt_inv     0.947525         1.000000
                 funded_amnt  funded_amnt_inv
funded_amnt          1.00000          0.92876
funded_amnt_inv      0.92876          1.00000

猜你喜欢

转载自blog.csdn.net/weixin_43172660/article/details/83960665

(Pearson)皮尔逊相关系数和spearman相关系数（附python实现）

Python 实现计算相关系数皮尔逊相关系数 Pearson、Spearman

Pearson、Spearman秩相关系数、kendall等级相关系数 (附python实现)

Pearson（皮尔逊）相关系数与Spearman（斯皮尔曼）相关系数及其SPSS实现

Pearson相关系数与Spearman相关系数

皮尔逊Pearson相关系数python代码实现

Pearson(皮尔逊)相关系数

pearson相关系数和Spearman相关系数的区别

数学建模：相关性分析学习——皮尔逊（pearson）相关系数与斯皮尔曼（spearman）相关系数

Python计算皮尔逊 pearson相关系数

统计学三大相关系数之Pearson相关系数、Spearman相关系数

pearson相关系数

皮尔森Pearson相关系数 VS 斯皮尔曼Spearman相关系数

皮尔森相关系数、皮尔逊相关系数（Pearson correlation coefficient）的存在性问题

三大相关系数: pearson, spearman, kendall（python示例实现）

皮尔逊相关系数mapreduce实现

Python计算皮尔逊相关系数

皮尔逊相关系数丨Pearson’s correlation coefficient

数学建模--相关系数（皮尔逊person相关系数和斯皮尔曼spearman等级相关系数）

相关系数之皮尔逊系数

斯皮尔曼（spearman）相关系数python代码实现

ML之PPMCC：PPMCC皮尔逊相关系数(Pearson correlation coefficient)、Spearman相关系数的简介、案例应用之详细攻略

数学建模皮尔逊person相关系数和斯皮尔曼spearman等级相关系数Matlab实现代码

相关性检验–Spearman秩相关系数和皮尔森相关系数

Excel Spearman相关系数

三大统计相关系数：Pearson、Spearman秩相关系数、kendall等级相关系数

Python三种方法计算皮尔逊相关系数（Pearson correlation coefficient）

pearson相关系数计算

【笔记】pearson相关系数

Pearson 相关系数扩展学习

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)