学习笔记
参考书目:《统计学:从数据到结论》-吴喜之;
关于正态性检验问题
- 利用QQ图进行正态性检验
关于检测正态性的直观方法为正态QQ图,它绘制样本数据的分位与理论正态分布的分位图形。如果绘制的点形成了一条直对角线,说明观测数据服从正态分布。
R语言实现:
qqnorm(new_data)
qqline(new_data)
图像:
- Shapiro正态性检验
我们也可以用Shapiro正态性检验来判定样本数据的正态性,它的原假设和备择假设为: 数据来自正态总体; 数据不是来自正态总体。
R语言实现:
> shapiro.test(new_data)
Shapiro-Wilk normality test
data: new_data
W = 0.96696, p-value = 0.2872
可以看到,p值大于0.05的显著性水平,但是我们不能证明样本数据就是服从正态分布的,只能说不能拒绝样本来自于正态总体的原假设。
我们来证明一下,即使p值较大,也不能说样本数据服从正态分布的观点。
我们取有序的正整数序列[1:30]进行Shapiro正态性检验,众所周知,正整数序列完全不是正态的。
> x1 <- c(1:30)
> shapiro.test(x1)
Shapiro-Wilk normality test
data: x1
W = 0.95745, p-value = 0.2662
我们看到正整数序列[1:30]不能拒绝原假设,但它绝不是正态的