学习笔记
参考书籍:《统计学》-贾俊平;《统计学:从数据到结论》-吴喜之;
原理部分移步:参数估计
一个正态总体均值的区间估计
产品重量数据:
74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5
79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0
75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0
73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5
假定,产品重量数据所代表的总体服从正态分布,且我们不知道总体方差,利用R我们可以计算出总体均值的置信度为95%的置信区间.
读取数据:
Tdata <- read.table("data5.txt", header = F)
new_data <- as.vector(as.matrix(Tdata))
计算置信区间:
> t.test(new_data, con = 0.95)$conf
[1] 72.38747 74.89253
attr(,"conf.level")
[1] 0.95
输出的总体均值的置信度为95%的置信区间为:(72.38747, 74.89253)
两个正态总体均值之差的区间估计
两个城市的AQI数据:
AQI1 55 52 42 32 37 36 57 66 66 62 45 77 78 60 65 66 91 98 99 90 76
AQI2 117 52 92 108 142 160 148 167 181 89 79 96 115 56 50 70 69 144 73 85 104
假定俩个城市的AQI数据所代表的总体服从正态分布,我们可以利用R语言计算出置信度为95%的两个总体均值之差的置信区间。
按照步骤,在进行区间估计之前,我们应该先判断两个总体的方差是否相等,如何判断方差是否相等呢?, 可以用var.test(x, y)函数去检验。如果检验得到的p值很小,小于我们设定的显著性水平,则认为方差不相等;若得到的p值很大,也不能判断方差相等,只能说证明不了方差不等。有些时候,我们可以直接用方差不等的方法去进行区间估计,也不会存在任何问题,因为即使方差相等,结果差别也不大。
这里我们依然给出方差相等和方差不等的区间估计的两种计算结果
读取数据:
aqi <- read.csv("Tdata.csv", header = T)
- 方差不等
> (mean(aqi$AQI1) - mean(aqi$AQI2))
[1] -40.33333
> t.test(aqi$AQI1, aqi$AQI2)$conf
[1] -60.01738 -20.64928
attr(,"conf.level")
[1] 0.95
- 方差相等
> t.test(aqi$AQI1, aqi$AQI2, var = T)$conf
[1] -59.80372 -20.86295
attr(,"conf.level")
[1] 0.95