Prueba T, prueba de chi-cuadrado, prueba F

Prueba T respectivamente prueba T de muestra única, prueba T de muestra independiente, prueba T de muestra pareada.

La prueba T requiere que la muestra cumpla con dos condiciones: 1. La muestra obedece a una distribución normal. 2. Cada muestra es independiente.

 

Prueba T de una muestra : inferir la probabilidad de la diferencia, para comparar si la diferencia entre dos promedios es significativa. En términos simples, es comparar la media muestral con la media poblacional conocida para observar la diferencia entre la muestra y la población.

Ejemplo: ¿Verifica que la capacidad de la botella de agua mineral sea de 550 ml?

Ahora hay 16 muestras de botellas de agua mineral, a saber, 558, 551, 542, 557, 552, 547, 551, 549, 548, 551, 553, 557, 548, 550, 546, 552

Paso 1: Calcule la media muestral \ bar {X}= (558 + 551 + ... + 552) /8=550.75

Paso 2: Calcule la desviación estándar de la muestra S = \ sqrt \ frac {\ sum_ {i = 1} ^ {n} (X_ {i} - \ bar {X}) ^ 2} {n}, es decir ((558-550.75) ^ 2 + (542-550.75) ^ 2 + ..) / 16 = 4.25

Paso 3: Calcular estadísticas \ frac {\ bar {X} - \ mu} {S / \ sqrt {n}}, donde \ mues la media general 550, n es el número de muestras 16, por lo que el resultado es (550,75-550) / (4,25 / 4) = 0,706

Paso 4: Consulte la tabla para obtener el estadístico teórico 0.821, que se compara con el estadístico real 0.706. Las estadísticas reales son menores que las estadísticas teóricas, lo que indica que la botella de agua mineral está calificada. También se puede ver en la fórmula de cálculo que si todos los tamaños de muestra son 550, entonces la estadística es 0, por lo que cuanto menor sea la estadística, mejor. Al mirar la tabla, la confianza y la libertad están involucradas. La confianza común es 90%, 95% y 99%. La definición más común de libertad es el número de muestras -1, que es 15.

 

Prueba T de muestra independiente : prueba la diferencia entre dos grupos de datos de muestra no relacionados.

Ejemplo: Verifique la diferencia en la capacidad de las botellas de agua mineral producidas entre dos producciones diferentes. Aquí hay otro conjunto de 16 muestras de botellas de agua mineral, a saber, 555, 553 ...

Se calcula de la siguiente manera: t es el estadístico \ bar {X_1}, \ bar {X_2}representativo de la media de los dos conjuntos de datos n_1, n_2representa el número de muestras S_1 ^ 2, S_2 ^ 2representativo de la varianza de las dos matrices. Puede verse en la fórmula de cálculo que cuanto menor es la t, menor es la diferencia entre los dos conjuntos de datos. Si la diferencia entre los dos conjuntos de datos es significativa según el grado de confianza y el grado de libertad.

t = \ frac {{\ bar {X_1} - \ bar {X_2}}} {\ sqrt {\ frac {({n_1} -1) {S_1} ^ 2 + ({n_2} -1) {S_2} ^ 2} {{n_1} + {n_2} -2} (\ frac {1} {n_1} + \ frac {1} {n_2})}}

 

Prueba T de muestras pareadas : prueba la diferencia de un conjunto de datos de muestra en diferentes condiciones o en diferentes momentos. Es una versión extendida de la prueba T de una muestra.

Ejemplo: Verifique la diferencia en el volumen de botellas de agua mineral producidas en el mes anterior y el mes siguiente en la misma sala de producción.

Suponga que hay 4 botellas de agua mineral producidas en julio en una sala de producción con capacidades de 551, 553, 549 y 547. Las 4 botellas de agua mineral producidas en agosto tienen capacidades de 552, 553, 548 y 547.

Paso 1. Calcule la diferencia d entre los dos conjuntos de datos de muestra, a saber, 551-552,553-553,549-548,547-547

Paso 2: Calcule el valor promedio de la diferencia d \ bar {d}, es decir (-1 + 0 + 1 + 0) / 4 = 0

Paso 3: Calcule la desviación estándar de la diferencia d Dakota del Sur, la fórmula de cálculo esS_d = \ sqrt \ frac {\ sum_ {i = 1} ^ {n} (d_ {i} - \ bar {d}) ^ 2} {n-1}

Paso 4: Calcule el estadístico t, la fórmula de cálculo es t = \ frac {\ bar {d} - \ mu} {s_d / \ sqrt {n}}, donde \ mues el valor medio de la diferencia total teórica 0 (dos conjuntos de productos producidos en la misma producción deben tener el mismo tamaño), n es el número de muestra 4. De manera similar, cuanto menor es t, más significa que la diferencia no es significativa Según el grado de confianza y el grado de libertad, la comparación de las estadísticas teóricas puede determinar si la diferencia entre los dos conjuntos de datos es significativa. Al comparar la prueba T de muestra única, podemos ver que su proceso de cálculo es muy similar.

 

Prueba F: Determine si hay una diferencia significativa entre los dos conjuntos de datos.

Paso 1: Calcule la media de los dos conjuntos de datos de muestra respectivamente\ bar {X}

Paso 2: Calcule el cuadrado de la desviación estándar de los dos conjuntos de datos de muestra.S ^ 2 = \ frac {\ sum_ {i = 1} ^ n (X_i- \ bar {X}) ^ 2} {n-1}

Paso 3: Calcule la relación al cuadrado de la desviación estándar de los dos conjuntos de datos de muestra F = \ frac {max (S_1 ^ 2, S_2 ^ 2)} {min (S_1 ^ 2, S_2 ^ 2)}, tomando el cuadrado más grande como numerador y el más pequeño como denominador. Después de obtener el valor F, compare los dos grupos de datos en función del grado de libertad y confianza. De manera similar, cuanto menor sea el valor F, más no será la diferencia significativa.

 

Prueba de chi-cuadrado: el grado de desviación entre el valor de observación real de la muestra estadística y el valor teórico inferido. El grado de desviación entre el valor de observación real y el valor teórico inferido determina el tamaño del valor de chi-cuadrado. Si el valor de chi-cuadrado es mayor, las dos desviaciones Cuanto mayor es el grado; por el contrario, menor es la desviación entre los dos; si los dos valores son completamente iguales, el valor de chi-cuadrado es 0, lo que indica que el valor teórico está completamente de acuerdo.

Ejemplo: Lanza una moneda 50 veces y juzga si la moneda está horizontal según el resultado de la observación, es decir, si la probabilidad del anverso y el reverso es la misma.

  positivo anti-
Tiempos reales 28 22
Tiempos teóricos 25 25

La fórmula para calcular el valor de chi-cuadrado es :, X ^ 2 = \ sum_ {i = 1} ^ n \ frac {(teoría real) ^ 2} {teoría}es decir (28-25) ^ 2/25 + (22-25) ^ 2/25 = 0.72, y luego busque la tabla según el grado de libertad y el grado de confianza. El grado de libertad aquí no es el mismo que el de la prueba T , Es (número de filas de la tabla-1) * (número de columnas de la tabla-1) = (2-1) * (2-1) = 1. De manera similar, cuanto menor es el valor de chi-cuadrado, más no es significativa la diferencia.

Tanto la prueba F como la prueba T son pruebas cuantitativas, la prueba F es más sencilla de calcular que la prueba T y la prueba de chi-cuadrado es una prueba cualitativa.

Enlace de referencia: https://www.zhihu.com/question/63191726

Supongo que te gusta

Origin blog.csdn.net/qq_33391629/article/details/108641331
Recomendado
Clasificación