T检验、卡方检验、F检验

T检验分别单样本T检验、独立样本T检验、配对样本T检验。

T检验要求样本满足两个条件:1、样本服从正态分布。2、各样本之间是独立的。

单样本T检验:推论差异发生的概率,从而比较两个平均数的差异是否显著。通俗的说就是用样本均数和已知总体均数进行比较,来观察此组样本与总体的差异性。

例子:验证矿泉水瓶容量是否为550ml?

现在有16个矿泉水瓶样本,分别为558、551、542、557、552、547、551、549、548、551、553、557、548、550、546、552

步骤一:计算样本均值\bar{X}=(558+551+...+552)/8=550.75

步骤二:计算样本标准差S=\sqrt\frac{\sum_{i=1}^{n}(X_{i}-\bar{X})^2}{n},即((558-550.75)^2+(542-550.75)^2+..)/16=4.25

步骤三:计算统计量\frac{\bar{X}-\mu }{S/\sqrt{n}},其中\mu为整体均值550,n为样本数16,所以结果为(550.75-550)/(4.25/4)=0.706

步骤四:查表得到理论统计量0.821,与实际统计量0.706对比大小。实际统计量小于理论统计量,说明矿泉水瓶是合格的。从计算公式也能看出来,如果所有样本容量都是550,那么统计量就是0,故统计量越小越好。查表时涉及到置信度和自由度,置信度常见的就是90%、95%、99%这三个,自由度通俗的说就是抽样样本数-1,即15。

独立样本T检验:检验两组非相关样本数据的差异性。

例子:验证两个不同生产间生产的矿泉水瓶容量的差异。再来一组16个矿泉水瓶样本,分别为555、553...

计算公式如下:t为统计量,\bar{X_1}\bar{X_2}代表两组数据的均值,n_1n_2代表样本数,S_1^2S_2^2代表两组数组的方差。从计算公式能看出来,t越小则两组数据差异性越小。具体多小就根据置信度和自由度查表对比理论统计量的大小得出两组数据差异性是否显著。

t=\frac{​{\bar{X_1}-\bar{X_2}}} {\sqrt{\frac{({n_1}-1){S_1}^2+({n_2}-1){S_2}^2} {​{n_1}+{n_2}-2} (\frac{1}{n_1}+\frac{1}{n_2} )}}

配对样本T检验:检验一组样本数据在不同条件或不同时间下的差异性。它是单样本T检验的扩展版。

例子:验证同一个生产间上一月与下一月生产的矿泉水瓶容量的差异。

假设有一个生产间7月生产的4个矿泉水瓶容量为551、553、549、547。8月生产的4个矿泉水瓶容量为552、553、548、547。

步骤一、计算两组样本数据差值d,即551-552,553-553,549-548,547-547

步骤二、计算差值d的平均值\bar{d},即(-1+0+1+0)/4=0

步骤三、计算差值d的标准差S_d,计算公式为S_d=\sqrt\frac{\sum_{i=1}^{n}(d_{i}-\bar{d})^2}{n-1}

步骤四、计算统计量t,计算公式为t=\frac{\bar{d}-\mu} {s_d/\sqrt{n}},其中\mu为理论总体差值均值0(同一生产间生产的两组产品应该是一样大的),n为样本数4。同样的,t也是越小越说明差异性不显著,具体多小就根据置信度和自由度查表对比理论统计量的大小得出两组数据差异性是否显著。对比单样本T检验,可以看出它们的计算过程是很相似的。

F检验:判断两组数据是否存在显著差异。

步骤一:分别计算两组样本数据的均值\bar{X}

步骤二:分别计算两组样本数据的标准方差的平方S^2=\frac{\sum_{i=1}^n(X_i-\bar{X})^2} {n-1}

步骤三:计算两组样本数据标准方差的平方比F=\frac{max(S_1^2,S_2^2)} {min(S_1^2, S_2^2)},把平方大的作为分子,小的作为分母。得到F值后根据两组数据的自由度和置信度查表对比,同样的,F值也是越小越说明差异性不显著。

卡方检验:统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。

例子:一枚硬币投50次,根据观察结果判断硬币是否均横,即正反面出现概率是否一样。

 
实际次数 28 22
理论次数 25 25

卡方值计算公式:X^2=\sum_{i=1}^n\frac{(real-theory)^2}{theory},即(28-25)^2/25+(22-25)^2/25=0.72,再根据自由度和置信度查表对比,此处自由度跟T检验不一样,它是(表格行数-1)*(表格列数-1)=(2-1)*(2-1)=1。同样的,卡方值也是越小越说明差异性不显著。

F检验和T检验都是定量检验,F检验比T检验计算更简单,卡方检验是定类检验。

参考链接:https://www.zhihu.com/question/63191726

猜你喜欢

转载自blog.csdn.net/qq_33391629/article/details/108641331