Fácil de entender le dice: ¿Cuál es el intervalo de confianza del 95%?

Producido por el analista de datos CDA

El concepto de intervalo de confianza fue presentado por el estadístico estadounidense Jerzy Naiman de Polonia.

Simplemente entienda, por ejemplo, si viaja de Beijing a Zhangjiajie durante 5 días, es posible que no pueda decir exactamente cuánto costará, pero puede dar un rango, como 10000-13000, se sentirá más creíble. Si el rango dado es demasiado grande, como 10000-30000, aunque la credibilidad es mayor, un rango tan grande es de poca importancia; si el rango dado es pequeño, como 10000-10500, aunque se mejora la precisión, puede ser La fiabilidad no parece ser muy alta. Encontrar un rango de valoración adecuado es un problema a resolver mediante el intervalo de confianza.

Cuando se trata de intervalos de confianza, tenemos que hablar sobre la estimación puntual y la estimación de intervalo.

Entonces, ¿qué es la estimación puntual? ¿Qué es la estimación por intervalos?

He visto un ejemplo así antes, que puede explicar perfectamente este problema ~

Una tarjeta de rascar era popular antes:

Las reglas del juego son (suponiendo que solo haya un bote):

· El gran premio se fija por adelantado y debe imprimirse en una tarjeta de rascar

· Después de comprar una tarjeta de rascar, sabrá si ganó

Luego tenemos al menos dos estrategias para raspar premios:

· Estimación puntual : compre uno, lo que equivale a adivinar que ganará (use directamente estadísticas de muestra para estimar el valor general del parámetro)

· Estimación de intervalo : compre una caja, lo que equivale a adivinar que habrá un cierto premio en esta caja (de acuerdo con las estadísticas de la muestra, de acuerdo con un cierto tamaño de probabilidad, incluido el valor general del parámetro)

Obviamente, la tasa de aciertos de la estimación del intervalo será mayor (por supuesto, el costo será mayor porque se reduce el riesgo).

En realidad:

Los estimadores puntuales son estadísticas de muestra utilizadas para estimar los parámetros generales. Pero no podemos esperar que el estimador puntual proporcione el valor exacto del parámetro general, por lo que a menudo sumamos o restamos el error de estimación para calcular la estimación del intervalo.

La forma general de estimación de intervalo es: estimación puntual ± error marginal.

Hay un componente cuya longitud θ es desconocida, y estimamos que θ es de 9 cm, lo que no es suficiente. Si podemos saber que la probabilidad de θ es del 95% (8,7 cm, 9,2 cm), entonces es mucho más ideal.

Luego de esto hemos llevado a otras dos palabras clave:

Intervalo de confianza y nivel de confianza

Entre ellos (8,7 cm, 9,2 cm) podemos entender el intervalo de confianza, entonces el 95% es el nivel de confianza.

El intervalo de estimación de los parámetros generales construidos por las estadísticas de muestra es el intervalo de confianza. Dado que el estadístico determina hasta cierto punto que este intervalo contendrá los parámetros generales verdaderos, se nombra el intervalo de confianza. En estadística, el intervalo de confianza de una muestra de probabilidad es una estimación de intervalo de un determinado parámetro general de esta muestra. El intervalo de confianza muestra cuánto cae el valor verdadero de este parámetro alrededor del resultado de la medición con una cierta probabilidad. El intervalo de confianza proporciona la credibilidad del valor medido del parámetro medido, que es la "cierta probabilidad" requerida anteriormente. Esta probabilidad se llama nivel de confianza.

Para entenderlo simplemente, extraemos 100 muestras. Cuando cambia la muestra continuamente, el 95% de los 100 intervalos de confianza de los parámetros generales construidos a partir de 100 muestras contienen los valores verdaderos de los parámetros generales, y el 5% no. Este 95% se llama nivel de confianza, que es 1-α.

Aquí hay un resumen de los niveles de confianza comunes.

Entonces, ¿cómo se establece un intervalo de confianza?

El establecimiento del intervalo de confianza está relacionado con el teorema del límite central y la distribución del muestreo. Bajo la condición de un nivel de confianza dado, el ancho del intervalo de confianza depende de la distribución del muestreo, y disminuirá con el aumento del tamaño de la muestra. El ancho del intervalo de confianza aumenta a medida que aumenta el factor de confianza.

Por ejemplo, si desea conocer la estatura promedio de los hombres adultos en el país, puede usar el método de muestreo para estimar la información general utilizando información de muestra. Se toma una muestra de los hombres nacionales. El valor promedio de esta muestra y una estimación puntual del promedio general. Cuando hay varias muestras, hay estimaciones puntuales múltiples, pero no sé qué muestra estima la población más correctamente, así que uso el intervalo Estimado para resolver este problema. Suponiendo que la altura promedio de los varones adultos en el país está entre 165-175 cm, este intervalo se llama intervalo de confianza, y [165,175], el nivel de confianza de este intervalo se expresa por el nivel de confianza, el nivel de confianza se refiere a la probabilidad de que el intervalo de confianza contenga el promedio general Por ejemplo, el nivel de confianza es del 95%.

Por supuesto, cuando se utilizan diferentes tipos de estimación de intervalos en diferentes situaciones, la distribución utilizada también es diferente. Aquí hacemos una breve comprensión,

1. Para un parámetro de muestra total:

2. Cuando dos parámetros de muestra generales:

Tomemos una estimación de intervalo de la media de la población como un ejemplo para comprender:

[Ejemplo] Una empresa de producción de alimentos produce principalmente alimentos en bolsas. Para controlar la calidad de los alimentos, el departamento de inspección de calidad de la empresa a menudo realiza verificaciones puntuales para analizar si el peso de cada bolsa cumple con los requisitos. Ahora se seleccionan al azar 25 bolsas de un lote de alimentos producidos en un día determinado, y el peso de cada bolsa se mide como se muestra en la tabla a continuación. Se sabe que la distribución de los pesos de los productos sigue una distribución normal, y la desviación estándar general es de 10 g. Intente estimar el intervalo de confianza del peso promedio del lote de productos, con un nivel de confianza del 95%.

El intervalo de confianza del peso promedio de los alimentos es 101.44g ~ 109.28g

Vamos a arreglarlo de nuevo a través de una pregunta práctica:

Seleccione aleatoriamente 100 cajas de un lote de productos para la inspección de calidad, y 72 de los resultados de la prueba están calificados. Intente estimar el intervalo del lote de productos con una certeza del 95%, y señale el error de muestreo promedio y el error límite de la muestra .

Estimación de intervalo de tasa de aprobación:

Según el título, podemos ver: n = 100 p = 72% 1-α = 0.95

Porque p ± Zα / 2 · {p (1-p) / n} ½ (intervalo de confianza de la relación general)

α = 0.05 Busque la tabla y obtenga Zα / 2 = 1.96

Obtenga p ± Zα / 2 · {p (1-p) / n} ½

= 0.72 ± 1.96 × {0.72 (1-0.72) / 100} ½

= 0.72 ± 1.96 × (0.448 / 10)

= 0.72 ± 0.088

El intervalo es [0.632, 0.808]

En la epidemia actual, el ritmo acelerado del pasado finalmente se ha ralentizado, y también es hora de pensar en su plan de carrera y plan de vida. ¡Prepárese con anticipación, planifique con anticipación y almacene energía para el futuro listo para ir!

2739 artículos originales publicados · Me gusta 276 · Visitas 560,000+

Supongo que te gusta

Origin blog.csdn.net/yoggieCDA/article/details/105635204
Recomendado
Clasificación