[Estadísticas Notas nueve] análisis de la varianza (ANOVA)

[Estadísticas Notas nueve] análisis de la varianza (ANOVA)

ANOVA (análisis de varianza, denominado ANOVA)


Análisis de la varianza (ANOVA), también conocido como "análisis de la varianza" o "prueba F" es RAFister invención para prueba de significación para dos o más de muestra las diferencias de medias.

Debido a varios factores, el Instituto obtuvo datos fluctuaron similares.

Causas fluctuaciones se pueden dividir en dos categorías: una es factores aleatorios no controlables, otros factores son controlados estudio en forma aplicada influencia en los resultados.

El análisis de varianza definición:

El análisis de varianza fue argumentos categóricos si hay un impacto significativo en el valor del tipo de variable dependiente mediante el examen de cada media de la población es igual a juez.


La idea básica de análisis de la varianza

Mediante el análisis de las diferentes fuentes de los estudios de variación de la contribución a la variación total, determinando de este modo el tamaño de factores controlables influir en los resultados del estudio.

Desde el punto de vista formal, el análisis de la varianza es relativamente más población media igualdad, pero es esencialmente un estudio de la relación entre las variables.

Y un resultado numérico cuando la relación entre las variables analizadas en el estudio de una o más variables categóricas varianza más de uno de los principales métodos de ellos. Esto tiene mucho en común con el análisis de regresión, pero hay diferencias esenciales.

El análisis de la prueba de varianza no sólo puede mejorar la eficiencia, y debido a que combina toda la información de la muestra, lo que aumenta la fiabilidad del análisis.

¿Por qué?

Por ejemplo, es población supuesta media 4 están  \ Mu 1,, \ Mu 2, \ Mu 3, \ Mu 4si generalmente se supone que el método de ensayo, tal como t-test, dos muestras pueden único estudio, para probar la media general 4 son iguales, las comparaciones por pares necesidad hizo 6 inspección secundaria.

Inspección H _ {0} {}1: \ Mu 1 = \ Mu 2

Prueba H _ {0} {}2: \ Mu 1 = \ Mu 3

Inspección H _ {0} {}3: \ Mu 1 = \ Mu 4

Inspección H _ {0} {}4: \ Mu 2 = \ Mu 3

Inspección H _ {0} {}5: \ Mu 2 = \ Mu 4

Inspección H _ {0} {}6: \ Mu 3 = \ Mu 4

Obviamente, tal comparación es muy complicado! Si la  \ Alpha = 0,05probabilidad de que cada inspección hecha error Clase I es de 0,05, para un número de pruebas que será el tipo aumenta la probabilidad de error I correspondientemente hizo cuando se haya completado la prueba, hacer que la probabilidad de error tipo I será mayor que 0,05, es decir, continuo probabilidad 6 de prueba para cometer error tipo I es:

1- \ left (1- \ alpha \ right) ^ {6} = 0,265, El nivel de confianza se reducirá a 0.735 (es decir, 0.95 ^ {6}).

En general, con el aumento en el número de pruebas de significación individual de los factores causales que conducen a la posibilidad de que las diferencias se incrementará. El análisis de varianza está teniendo en cuenta todas las muestras, excluyendo así la probabilidad de acumulación de errores, evitando así rechazar una hipótesis nula verdadera.

 

Ejemplo: Hay tres máquinas en la misma especificaciones de producción de hoja de aleación de aluminio, para poner a prueba el espesor de las tres máquinas son los mismos para la producción de la hoja, la hoja se produce al azar por cada máquina en cada una de las cinco muestras extraídas, los resultados medidos son los siguientes:

Pregunta: ¿Existe una diferencia significativa en el espesor de la lámina producir tres máquinas?

Este problema se resuelve mediante un análisis de varianza.

En Excel, la generación de las anteriores tres máquinas - un conjunto de datos de muestra Los datos de muestra de cinco tabla de ANOVA :

SS representa la suma de cuadrados, df grado de libertad, la MS indica cuadrado medio, F es la estadísticas de prueba, P-valor P-valor para la prueba, F _ {{crit}} para un determinado  \alfa nivel de valor crítico.

Al tomar una decisión puede ser analizada en el valor de la tabla P significativos varianza  \alfa valores se comparan.

Cuando la tabla de análisis de varianza, análisis de la varianza:

Si: F> F _ {\ alpha}entonces rechazar la hipótesis nula  H _ {0} {};

Si: F <F _ {\ alpha}no se rechaza la hipótesis nula  H _ {0} {}.

Puede también, PAG y  \alfa la determinación de la relación:

Si: P <\ alphaentonces rechazada  H _ {0} {};

Cuándo: P> \ alpha, no se rechaza  H _ {0} {}.

En la presente realización, a partir de la tabla de análisis de la varianza, se puede observar:

Puesto que (2,12) = 3,89 <32.92 , se rechaza , que cada espesor de la hoja producida máquinas significativamente diferentes . 

Aquí hemos utilizado el principio de la prueba y el análisis de la varianza (ANOVA) hipótesis.


El análisis de varianza de clasificación

ANOVA

Dependiendo del tipo de datos de diseño, hay dos métodos de análisis de la varianza:

1, una pluralidad de grupos de muestras se compararon diseño, debe ser diseño completamente al azar por análisis de varianza, es decir ANOVA .

2, diseño de bloque aleatorizado múltiples se compararon, grupo de compatibilidad debe diseñar análisis de la varianza, que utiliza ANOVA de dos vías .

ANOVA (One Way ANOVA)

ANOVA factor único se refiere a los resultados del análisis, el método afectada significativamente por la presencia o ausencia de factores de prueba en los resultados de la prueba.

comparación ANOVA de dos extensión medias de la muestra, que se utiliza para probar la diferencia entre el promedio de una pluralidad, un método estadístico para determinar la presencia o ausencia de factores significativos que afectan a los resultados de la prueba.

Bidireccional método ANOVA (análisis de dos vías de la varianza)

Dos vías de análisis ANOVA es un método de análisis estadístico, este método de análisis se puede utilizar para analizar los diferentes niveles de dos factores en los resultados si hay una interacción entre la existencia de un impacto significativo, así como dos factores. Usando el método general de ANOVA de dos vías, una combinación de diferentes niveles de los dos primeros factores, el diseño de la prueba, el contenido de cada combinación requerida de las muestras obtenidas son los mismos.

En el estudio de problemas prácticos, ya veces es necesario considerar el impacto de dos factores en los resultados experimentales. Por ejemplo, las ventas de bebidas, además de colores fuera de la bebida en cuestión, queremos saber si el impacto en las ventas del área de ventas, si en las diferentes regiones, existen diferencias significativas en las ventas, es necesario analizar las razones. El uso de diferentes estrategias de marketing para que las marcas de bebidas populares continuaron elevada cuota de mercado en la región, para mantenerse por delante; baja cuota de mercado en la región, para ampliar aún más la promoción, para que más consumidores la comprensión, la aceptación del producto. Si el color es visto como factores de ventas de una bebida, regiones de ventas de bebidas son factores B. Los factores se analizaron también los factores A y B, pertenece a un análisis de contenido de ANOVA de dos vías, de dos vías análisis ANOVA de influir factores a prueba, si se trata de un factor de todos juegan un papel en el trabajo, o en dos factores, o dos factores que no significativa.

análisis Paso

El paso básico de análisis de la varianza de los dos, pero diferentes variaciones de una forma en despiece ordenado, el diseño del grupo de información, la variación total se descompone en la variación entre los grupos y variabilidad grupo (errores aleatorios), a saber: Total = Habitación SS SS SS grupo grupo + en el interior, mientras que el grupo de compatibilidad de datos de diseño, excepto que la variación total y la variación dividido en grupos de tratamiento de errores aleatorios, que comprende además una variación del grupo de compatibilidad exterior, a saber: error al procesar SS = SS total compatibilidad + SS + SS. El paso básico del análisis de la varianza total de la siguiente manera:

1, el centro de pruebas de hipótesis;

H0: En general pluralidad igual media de muestras;
Hl: una pluralidad de muestras o insuficiencia media global desigual.
  El nivel de significación de 0,05.

2, F prueba estadística valor calculado;

3, para determinar el valor P y el resultado de inferencia.


Aplicación de análisis de varianza condicional

El análisis de varianza debe prestar atención a sus términos antes de que los datos eran inferencia estadística, incluyendo:

1, comparable. Si la información en cada uno de los grupos no eran comparables análisis de varianza en sí no se aplica.

2, la normalidad. Que el análisis de datos sesgada de la varianza no se aplica. distribución sesgada de los datos debe considerar el uso de una transformación logarítmica, transformación de raíz cuadrada, transformación recíproca, las variables arcoseno raíz cuadrada de transformación se transforman en un nivel normal o casi normal después de un análisis de varianza.

3, la homogeneidad de la varianza. Es decir, si el análisis de la varianza entre los grupos de varianza no se aplica faltan. Más prueba de homogeneidad de varianzas es método disponible de Bartlett, que utiliza el valor estadístico de prueba chi-cuadrado como resultado círculos de juicio tienen que ver una tabla de valores de chi-cuadrado.

El análisis de varianza se utiliza principalmente para:

1, la prueba de medias diferencia significativa;

2, todos los factores pertinentes y estimar su efecto sobre la separación de la varianza total;

3, el análisis de la interacción entre los factores;

4, prueba de homogeneidad de varianza.

 

 

Publicados 619 artículos originales · ganado elogios 185 · vistas 660 000 +

Supongo que te gusta

Origin blog.csdn.net/seagal890/article/details/105021319
Recomendado
Clasificación