统计学之方差分析

方差分析(Analysis of Variance,简称ANOVA),是用于两个及两个以上样本均数差别的显著性检验。方差分析中,由于各种因素的影响,研究所得的数据呈现波动状,这种波动可以分为组间波动和组内波动两种情况。
单因素方差分析:

食物1 食物2 食物3
3 5 5
2 3 6
1 4 7
均值:2 均值:4 均值:6

引入三个概念及算法:
(1)SST(Sum of squares for total)总离差平方和:
所有数据点离均值的距离的平方之和,假设有m组数据,每组n条数据,则自由度为mn-1。
SST=(3-4)²+(2-4)²+(1-4)²+(5-4)²+(3-4)²+(4-4)²+(5-4)²+(6-4)²+(7-4)²=30。
自由度:3x3-1=8。
(2)SSW(Sum of squares within)组内平方和:
各组内数据与组均值距离的平方之和,自由度为m
(n-1),因为在一组内知道n-1个点的信息就可以知道第n个点的信息,每组n个数据的自由度就是n-1,共m组,所以自由度为m*(n-1)。
SSW=(3-2)²+(2-2)²+(1-2)²+(5-4)²+(3-4)²+(4-4)²+(5-6)²+(6-6)²+(7-6)²=6。
自由度:3*(3-1)=6。
(3)SSB(Sum of squares between)组间平方和:
其所在组的均值减去总均值的平方和,把每一个组内的点当作这个组的组内均值来计算。自由度为m-1,因为知道m-1个组的均值就可以得到第m个组的均值。
SSB=(2-4)²+(2-4)²+(2-4)²+(4-4)²+(4-4)²+(4-4)²+(6-4)²+(6-4)²+(6-4)²=24。
自由度:3-1=2。

由此可见:SST=SSW+SSB

F统计量假设检验: F统计量是组间平方和同除以其自由度m-1,然后除以组内平方和除以其自由度m(n-1),如果分子比分母大很多,则说明大部分波动来自于各组之间,总体均值之间存在差异。如果这个数字很小,分母更大,则意味着组内波动比组间波动在总波动中占比更多,意味着差异可能是随机产生的。
即F-statistic=
零假设:吃三种食物对人体没有影响
备选假设:吃三种食物对人体有影响
带入公式:分子:24/2 分母:6/6 结果:12
查f分布表得:3.46(m为SSB自由度,n为SSW自由度)
12远大于3.46,故拒绝原假设,食物对人体是有影响的
在这里插入图片描述
双因素方差分析:

因素 地区1 地区2 地区3 地区4 地区5 行均值j
品牌1 365 350 343 340 323 344.2
品牌2 345 368 363 330 333 347.8
品牌3 358 323 353 343 308 337
品牌4 288 280 298 260 298 284.8
列均值i 339 330.25 339.25 318.25 315.5 328.45

在这里插入图片描述
在这里插入图片描述
其中:SSR=5*(344.2-328.45)²+5*(347.8-328.45)²5*(337.2-328.45)²5*(284.8-328.45)²=13004.55
SSC=4*(339-328.45)²+4*(330.25-328.45)²+4*(339.25-328.45)²+4*(318.25-328.45)²+4*(315.5-328.45)²=2011.7
SSE计算公式如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

发布了14 篇原创文章 · 获赞 0 · 访问量 542

猜你喜欢

转载自blog.csdn.net/hello_v_world/article/details/104346021