pearson相关系数

概述:

pearson相关系数用于比较两组变量是否线性相关,比如{a1,a2,a3,a4}与{b1,b2,b3,b4}他们都是同增加或者同减少,那么他们就是相关的。

取值:

相关系数的取值为-1<r<1,为0时表示不相干,正数的时候为正相关,负数的时候为负相关,如下所示:



 |r|取值与相关程度的关系如下所示:



适用条件:

1、两变量均应由测量得到的连续变量。

2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。

3、变量必须是成对的数据。

4、两变量间为线性关系。

计算方法:



 

其中
为x取值的平均值

因为样本和总体存在误差,因此对样本计算的结果还要进行假设检验

用途:

1.两组观察值是否有关系

2.两用户的两组评分那么他们是否相似
 

猜你喜欢

转载自snv.iteye.com/blog/2085371