R语言与正态总体均值的区间估计

学习笔记
参考书籍：《统计学》-贾俊平；《统计学：从数据到结论》-吴喜之；
原理部分移步：参数估计

一个正态总体均值的区间估计

产品重量数据：

74.3  78.8  68.8  78.0  70.4  80.5  80.5  69.7  71.2  73.5
79.5  75.6  75.0  78.8  72.0  72.0  72.0  74.3  71.2  72.0
75.0  73.5  78.8  74.3  75.8  65.0  74.3  71.2  69.7  68.0
73.5  75.0  72.0  64.3  75.8  80.3  69.7  74.3  73.5  73.5

假定，产品重量数据所代表的总体服从正态分布，且我们不知道总体方差，利用R我们可以计算出总体均值的置信度为95%的置信区间.

读取数据：

Tdata <- read.table("data5.txt", header = F)
new_data <- as.vector(as.matrix(Tdata))

计算置信区间：

> t.test(new_data, con = 0.95)$conf
[1] 72.38747 74.89253
attr(,"conf.level")
[1] 0.95

输出的总体均值的置信度为95%的置信区间为：(72.38747, 74.89253)

两个正态总体均值之差的区间估计

两个城市的AQI数据：

AQI1	55	52	42	32	37	36	57	66	66	62	45	77	78	60	65	66	91	98	99	90	76
AQI2	117	52	92	108	142	160	148	167	181	89	79	96	115	56	50	70	69	144	73	85	104

假定俩个城市的AQI数据所代表的总体服从正态分布，我们可以利用R语言计算出置信度为95%的两个总体均值之差的置信区间。

按照步骤，在进行区间估计之前，我们应该先判断两个总体的方差是否相等，如何判断方差是否相等呢？, 可以用var.test(x, y)函数去检验。如果检验得到的p值很小，小于我们设定的显著性水平，则认为方差不相等；若得到的p值很大，也不能判断方差相等，只能说证明不了方差不等。有些时候，我们可以直接用方差不等的方法去进行区间估计，也不会存在任何问题，因为即使方差相等，结果差别也不大。

这里我们依然给出方差相等和方差不等的区间估计的两种计算结果

读取数据：

aqi <- read.csv("Tdata.csv", header = T)

方差不等

> (mean(aqi$AQI1) - mean(aqi$AQI2))
[1] -40.33333
> t.test(aqi$AQI1, aqi$AQI2)$conf
[1] -60.01738 -20.64928
attr(,"conf.level")
[1] 0.95

方差相等

> t.test(aqi$AQI1, aqi$AQI2, var = T)$conf
[1] -59.80372 -20.86295
attr(,"conf.level")
[1] 0.95

山羊菌

发布了219 篇原创文章 · 获赞 102 · 访问量 9万+

私信关注

R语言与正态总体均值的区间估计

一个正态总体均值的区间估计

两个正态总体均值之差的区间估计

猜你喜欢