Mide el grado de correlación lineal entre dos variables . Primero dibuje un diagrama de dispersión para ver si existe una correlación lineal, luego el coeficiente de correlación será útil.
General: todos los individuos del objeto a examinar.
Muestra: una porción de individuos extraídos de una población.
Utilice estadísticas de muestra para estimar estadísticas de población.
Coeficiente de correlación general de personas
La covarianza Cov(X,Y) refleja la correlación entre X e Y
El coeficiente de correlación de Persona elimina la influencia de las dimensiones de las dos variables.
ρ_xy=Cov(X,Y)/ σ_x * σ_y
Muestra Coeficiente de correlación de persona
Cuanto más cerca esté el valor absoluto de ρ de 1, más cerca estará el mapa hash de una línea recta y mayor será la correlación.
Si XY es irrelevante, entonces ρ es 0 y no se puede deducir viceversa.
El tamaño del coeficiente de correlación se puede personalizar según el fondo.
Verificar la correlación lineal de las variables:
Importe los datos a SPSS, vaya a Gráficos-Cuadro de diálogo antiguo-Gráfico de dispersión/Gráfico de puntos y haga un gráfico entre los datos. Si el gráfico tiene una línea diagonal como la siguiente, es lineal:
Calcular en MATLAB: mínimo, máximo, promedio, etc. Obtener estadística descriptiva RESULTADO
MIN=min(A);
MAX=max(A);
MEAN=mean(A);
MEDIAN=median(A);
SKEWNESS=skewness(A);
KURTOSIS=kurtosis(A);
STD=std(A);
RESULT=[MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD]
%RESULT存放描述性统计
[R,p]=corrcoef(A)
R almacena coeficientes de correlación
prueba hipotética
Plantee sus propias hipótesis y verifique si sus suposiciones son correctas.
Nivel de confianza β =1-α: la probabilidad de que la hipótesis sea cierta (generalmente 90%, 95%, 99%)
Nivel de significancia α : ocurre un evento de pequeña probabilidad (la probabilidad de rechazar la hipótesis nula)
Función de densidad de probabilidad f(x) : la intensidad de probabilidad de que x ocurra aquí 1.f(x)>=0 2. La integral de infinito negativo a infinito es 1.
Función de densidad acumulada F(x) :F(x)<=P(X<x)
Región de aceptación: dentro del nivel de confianza
Dominio denegado: en otro lugar.
Probabilidad P
Paso 1: Determinar la hipótesis nula H0 y la hipótesis alternativa H1 (dos hipótesis completamente opuestas)
Prueba bilateral: ~=
Prueba unilateral: > o <
Paso 2: Bajo la condición de que se establezca la hipótesis nula, construya su propia distribución (N, t, F, distribución chi-cuadrado)
Las estadísticas sólo pueden contener una cantidad desconocida Z de la hipótesis.
Paso 3: Dibujar la función de densidad de probabilidad f(x)
Paso 4: proporcione un nivel de confianza β y encuentre el dominio de aceptación (busque la tabla o use matlab para calcular)
Paso 5: Utilice datos de muestra conocidos para calcular estadísticas y obtener el valor de la prueba . Si el valor de la prueba está dentro del rango de aceptación, acepte la hipótesis nula; de lo contrario, rechácela.
El valor de P obtenido mediante la prueba bilateral debe ser ×2 y luego compararse con el nivel de significancia α.
prueba de significancia
Coeficiente de correlación = 0 significa que no hay correlación.
Prueba de significancia: prueba la diferencia entre 0 y el coeficiente de correlación
Correlación significativa - relevante
La correlación no es significativa ni relevante.
Calcule el coeficiente de correlación de la persona r y pruebe si es significativamente diferente de 0:
Paso 1: Hipótesis original H0: r=0, hipótesis alternativa: H1: r~=0
Paso 2: Las estadísticas se pueden construir bajo ciertas condiciones
(La distribución t es un caso especial de la distribución normal estándar. Cuando n tiende a infinito, es la distribución normal estándar)
Paso 3: sustituya r en la fórmula para obtener el valor de prueba.
Paso 4: Dibuje la función de densidad de probabilidad pdf de la distribución, dado un nivel de confianza β, encuentre el valor crítico y dibuje la región de aceptación y la región de rechazo de la estadística.
%x=起始值:步长:终值;
%y=tpdf(x,自由度);
plot(x,y,'-')
grid on%画网格
Paso 5: Si el valor de la prueba está dentro de la región de rechazo, se establece H1; dentro de la región de aceptación, se establece H0.
método de juicio de valor p
Obtenga el valor de prueba t* y calcule la probabilidad correspondiente.
tcdf calcula la función de densidad de probabilidad acumulada.
%检验值对应的p值=(1-tcdf(检验值,自由度)*2)
%双侧检验的p值要乘以2
p<0.01, la hipótesis nula se rechaza al nivel de confianza del 99%; p>0.01, la hipótesis nula no se puede rechazar al nivel de confianza del 99%
p<0.05, la hipótesis nula se rechaza al nivel de confianza del 95%, p>0.05, la hipótesis nula no se puede rechazar al nivel de confianza del 95%;
p<0,10, se rechaza la hipótesis nula al nivel de confianza del 90%. p>0,10, la hipótesis nula no se puede rechazar al nivel de confianza del 90%.
Rechazar la hipótesis nula en este ejemplo significa que el coeficiente de correlación de Pearson es significativamente diferente de 0.
Marca de significancia, vacío no es significativo *Cuanto más significativo sea al 90%, es diferente de 0 **95% ***99%
SPSS es muy conveniente para el análisis de correlación.