Estadísticas_Jia Junping——Preguntas para pensar Capítulo 9 Análisis de datos categóricos

1. Describa brevemente la estructura y distribución de la tabla de contingencia.

Respuesta: Una tabla de contingencia es una tabla de distribución de frecuencias que clasifica de forma cruzada dos o más variables.

La distribución de la tabla de contingencia se puede ver desde dos aspectos, uno es la distribución de las observaciones, también conocida como distribución condicional, cada observación específica es la frecuencia condicional, la otra es la distribución de los valores esperados.

2. Construya una tabla de contingencia utilizando ejemplos de un periódico, una revista oa su alrededor, ilustrando la relación entre las dos variables categóricas en esta encuesta y haciendo preguntas para la prueba.

Respuesta: Realice inspecciones de calidad en los tres rendimientos A, B y C de las máquinas de aprendizaje proporcionadas por los tres fabricantes A, B y C, y desee saber si existe una relación entre las diferencias de calidad entre los fabricantes y el rendimiento de las máquinas de aprendizaje. Se revisaron aleatoriamente 450 máquinas de aprendizaje defectuosas y se clasificaron en una tabla de contingencia de 3 × 3, como se muestra en la Tabla 9-1.
inserte la descripción de la imagen aquí

De acuerdo con los datos de verificación e inspección al azar, muestra que el tipo de producto defectuoso no tiene nada que ver con el fabricante (es decir, qué fábrica) produce (es decir, son independientes entre sí).

Establecer supuestos: H0: El tipo de producto defectuoso es independiente de la producción del fabricante; H1: El tipo de producto defectuoso no es independiente de la producción del fabricante.

El valor esperado de cada grupo se puede calcular, como se muestra en la Tabla 9-2 (los valores entre paréntesis en la tabla son valores esperados).
inserte la descripción de la imagen aquí

Entonces χ 2 = ( 20 - 17 ) 2 / 17 + ( 40 - 33 ) 2 / 33 + . . . + ( 70 - 58 ) 2 / 58 = 9.821. x2 =(20-17)^2/17+(40-33)^2/33+...+(70-58)^2/58=9,821.x 2 ( 20 17 )2/17(4033)_2 /33...(7058)2 /589.821

Y el grado de libertad es igual a (R-1) (C-1) = (3-1) × (3-1) = 4, si la prueba se realiza al nivel de significación de 0.01, compruebe el χ^ 2 tabla de distribución y obtenga χ 0.01 2 ( 4 ) = 13.277 χ_{0.01}^ 2(4) = 13.277h0.012( 4 ) = 13.277 . Como $χ 2=9.821<χ_{0.01}^ 2(4)=13.277, se acepta la hipótesis nula H0, es decir, el tipo de producto defectuoso es independiente de la producción del fabricante.

3. Explicar el cálculo de χ 2 χ 2Pasos para el estadístico χ 2 .

Respuesta: Calcular χ 2 χ^2h2 pasos para las estadísticas:

(1) Usar el valor observado f 0 f_0F0Restar el valor esperado fe f_eFmi

(2)将(f 0 - fe f_0-f_eF0fmi) cuadrado de la diferencia;

(3) Elevar al cuadrado el resultado ( f 0 - fe f_0 - f_eF0fmi) 2 dividido por fe f_eFmi

(4) Sume los resultados del paso (3) para obtener:

χ 2 = ∑ ( f 0 − fe ) 2 fe \chi^2=\sum \frac{(f_0-f_e)^2}{f_e}h2=Fmi( f0Fmi)2

4. Describa brevemente las características respectivas del coeficiente φ, el coeficiente c y el coeficiente V.

Respuesta: (1) El coeficiente de correlación φ es el coeficiente de correlación más utilizado para describir el grado de correlación de los datos de la tabla de contingencia 2×2. Su fórmula de cálculo es:

φ = χ 2 / norte \varphi=\sqrt{\chi ^2 /n}Fi=h2 /norte

En la fórmula,

χ 2 = ∑ ( f 0 − fe ) 2 fe \chi^2=\sum \frac{(f_0-f_e)^2}{f_e}h2=Fmi( f0Fmi)2

El coeficiente φ obtenido se puede controlar en el rango de 0~1.

(2) El coeficiente de correlación de contingencia también se denomina coeficiente de contingencia, o coeficiente c para abreviar, y se utiliza principalmente en el caso de una tabla de contingencia mayor que 2×2. La fórmula para calcular el coeficiente c es:

c = χ 2 χ 2 + nc=\sqrt{\frac{\chi^2}{\chi^2 +n}}C=h2+norteh2

Cuando las dos variables de la tabla de contingencia son independientes entre sí, el coeficiente c=0, pero no puede ser mayor que 1. La característica del coeficiente c es que su valor máximo posible depende del número de filas y columnas de la tabla de contingencia, y aumenta con el aumento de R y C.

(3) Gramer propuso el factor V. La fórmula para calcular el factor V es:

V = χ 2 norte × min [ ( R − 1 ) , ( C − 1 ) ] V=\sqrt{\frac{\chi^2}{n \times min[(R-1),(C-1) ]}}V=norte×mi [( R1 ) ,( C1 )]h2

Cuando las dos variables son independientes entre sí, V=0; cuando las dos variables están completamente correlacionadas, V=1. Entonces el valor de V está entre 0 y 1. Si una dimensión en la tabla de contingencia es 2, es decir, min[(R-1),(C-1)]=1, entonces el valor de V es igual al valor de φ.

5. Construya una tabla de contingencia de las siguientes dimensiones y dé χ 2 χ^2h2 grados de libertad para probar.

a. 2 filas y 5 columnas

b. 4 filas y 6 columnas

C. 3 filas y 4 columnas

Respuesta: Una tabla de contingencia en las filas i y j, como se muestra en la Tabla 9-3.
inserte la descripción de la imagen aquí

x 2 x ^ 2h2 grados de libertad de la prueba = (número de filas - 1) (número de columnas - 1), entonces

a. Cuando i=2, j=5, la tabla 9-3 es una tabla de contingencia con 2 filas y 5 columnas, y los grados de libertad de la prueba χ 2=(2-1)×(5-1)=4;

b. Cuando i=4, j=6, la tabla 9-3 es una tabla de contingencia con 4 filas y 6 columnas, y el grado de libertad de la prueba χ 2=(4-1)×(6-1)=15;

C. Cuando i=3, j=4, la tabla 9-3 es una tabla de contingencia con 3 filas y 4 columnas, y el grado de libertad de la prueba χ 2=(3-1)×(4-1)=6.

Supongo que te gusta

Origin blog.csdn.net/J__aries/article/details/130857883
Recomendado
Clasificación