如何检验数据样本的正态性?

正态分布是自然界中最常见的也是一种最重要的分布。因此,人们在使用统计分析方法时,总是乐于正态假定,但该假定是否成立,就需要进行正态性检验了。

定义:

指如果一组观测值来自正态总体.具有正态分布的特性,就称该组观测值具有正态性。

检验方法:

1、图示法

1.1 PP图

P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地考察样本数据是否服从某一概率分布。如果样本数据服从所假定的分布,则散点较好地落在原点出发的45°线附近。

1.2 QQ图

Q-Q图的结果与P-P图相似,只是P-P图是用概率分布的累计比进行正态性考察,而Q-Q图是用概率分布的分位数进行正态性考察,同P-P图一样,如果样本数据对应的总体分布确为正态分布,则在Q-Q图中,样本数据对应的散点应基本落在原点出发的45°线附近。

1.3 直方图

判断频率密度直方图的密度曲线是否服从正态分布的密度曲线。密度曲线是否呈中间高、两边低、左右基本对称的“钟形”曲线

1.4 茎叶图

茎叶图的用途同直方图,它不仅具备与直方图相同的直观性,同时能精细表达样本数据的取值水平,当样本量小时,可以通过茎叶图进行正态性呈现

2、统计指示法

2.1 偏度和峰度

可参考https://blog.csdn.net/xbmatrix/article/details/69360167了解这两个统计量

正态分布的偏度系数为0,峰度系数为3,利用正态分布的这两个特性可以检验样本数据是否来自正态分布的总体。

2.2 偏度峰度联合检验法(Jarque-Bera)

参考https://baike.baidu.com/item/Jarque-Bera%E6%A3%80%E9%AA%8C/8821978

构造的统计指标为

JB=n6(b2s+14(bk-3)2)。

如果样本数据所来自的总体服从正态分布,,则JB近似服从自由度为2的卡方分布。

Jarque-Bera检验相比于其他检验方法更容易成功地接受正态性假定,即Ⅰ类错误风险较低

2.3 Shaprio-Wilk检验(W检验)

建立检验假设H0:样本数据所来自的总体服从正态分布,

(

2.4 Kolmogorov-Smirnov检验(K-S检验)

参考资料https://www.cnblogs.com/arkenstone/p/5496761.html

2.5 Cramér-VonMises检验

正态检验统计量

2.6 Anderson-Darling检验

正态检验统计量

软件实现方法

参考文献:

1、数值变量正态性检验常用方法的对比

2、偏度(skewness)和峰度(kurtosis)

猜你喜欢

转载自blog.csdn.net/beauty0522/article/details/82750682