Coeficiente de correlación de personas

Mide el grado de correlación lineal entre dos variables . Primero dibuje un diagrama de dispersión para ver si existe una correlación lineal, luego el coeficiente de correlación será útil.

General: todos los individuos del objeto a examinar.

Muestra: una porción de individuos extraídos de una población.

Utilice estadísticas de muestra para estimar estadísticas de población.

Coeficiente de correlación general de personas

La covarianza Cov(X,Y) refleja la correlación entre X e Y

El coeficiente de correlación de Persona elimina la influencia de las dimensiones de las dos variables. 

ρ_xy=Cov(X,Y)/ σ_x * σ_y 

 Muestra Coeficiente de correlación de persona

Cuanto más cerca esté el valor absoluto de ρ de 1, más cerca estará el mapa hash de una línea recta y mayor será la correlación.

Si XY es irrelevante, entonces ρ es 0 y no se puede deducir viceversa.

El tamaño del coeficiente de correlación se puede personalizar según el fondo.

Verificar la correlación lineal de las variables:

        Importe los datos a SPSS, vaya a Gráficos-Cuadro de diálogo antiguo-Gráfico de dispersión/Gráfico de puntos y haga un gráfico entre los datos. Si el gráfico tiene una línea diagonal como la siguiente, es lineal:

 Calcular en MATLAB: mínimo, máximo, promedio, etc. Obtener estadística descriptiva RESULTADO

MIN=min(A);
MAX=max(A);
MEAN=mean(A);
MEDIAN=median(A);
SKEWNESS=skewness(A);
KURTOSIS=kurtosis(A);
STD=std(A);
RESULT=[MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD]
%RESULT存放描述性统计

[R,p]=corrcoef(A)

R almacena coeficientes de correlación


prueba hipotética

        Plantee sus propias hipótesis y verifique si sus suposiciones son correctas.

Nivel de confianza β =1-α: la probabilidad de que la hipótesis sea cierta (generalmente 90%, 95%, 99%)

Nivel de significancia α : ocurre un evento de pequeña probabilidad (la probabilidad de rechazar la hipótesis nula)

Función de densidad de probabilidad f(x) : la intensidad de probabilidad de que x ocurra aquí 1.f(x)>=0 2. La integral de infinito negativo a infinito es 1.

Función de densidad acumulada F(x) :F(x)<=P(X<x)

Región de aceptación: dentro del nivel de confianza

Dominio denegado: en otro lugar.

Probabilidad P 

 

Paso 1: Determinar la hipótesis nula H0 y la hipótesis alternativa H1 (dos hipótesis completamente opuestas)

        Prueba bilateral: ~=

        Prueba unilateral: > o <

Paso 2: Bajo la condición de que se establezca la hipótesis nula, construya su propia distribución (N, t, F, distribución chi-cuadrado)

        Las estadísticas sólo pueden contener una cantidad desconocida Z de la hipótesis.
Paso 3: Dibujar la función de densidad de probabilidad f(x)

Paso 4: proporcione un nivel de confianza β y encuentre el dominio de aceptación (busque la tabla o use matlab para calcular)

 Paso 5: Utilice datos de muestra conocidos para calcular estadísticas y obtener el valor de la prueba . Si el valor de la prueba está dentro del rango de aceptación, acepte la hipótesis nula; de lo contrario, rechácela.

El valor de P obtenido mediante la prueba bilateral debe ser ×2 y luego compararse con el nivel de significancia α.


prueba de significancia

Coeficiente de correlación = 0 significa que no hay correlación.

Prueba de significancia: prueba la diferencia entre 0 y el coeficiente de correlación 

        Correlación significativa - relevante

        La correlación no es significativa ni relevante.

 Calcule el coeficiente de correlación de la persona r y pruebe si es significativamente diferente de 0:

Paso 1: Hipótesis original H0: r=0, hipótesis alternativa: H1: r~=0

Paso 2: Las estadísticas se pueden construir bajo ciertas condiciones

 (La distribución t es un caso especial de la distribución normal estándar. Cuando n tiende a infinito, es la distribución normal estándar)

Paso 3: sustituya r en la fórmula para obtener el valor de prueba.

Paso 4: Dibuje la función de densidad de probabilidad pdf de la distribución, dado un nivel de confianza β, encuentre el valor crítico y dibuje la región de aceptación y la región de rechazo de la estadística.

%x=起始值:步长:终值;
%y=tpdf(x,自由度);
plot(x,y,'-')
grid on%画网格

Paso 5: Si el valor de la prueba está dentro de la región de rechazo, se establece H1; dentro de la región de aceptación, se establece H0.

método de juicio de valor p

        Obtenga el valor de prueba t* y calcule la probabilidad correspondiente.

tcdf calcula la función de densidad de probabilidad acumulada.

%检验值对应的p值=(1-tcdf(检验值,自由度)*2)
%双侧检验的p值要乘以2

p<0.01, la hipótesis nula se rechaza al nivel de confianza del 99%; p>0.01, la hipótesis nula no se puede rechazar al nivel de confianza del 99%

p<0.05, la hipótesis nula se rechaza al nivel de confianza del 95%, p>0.05, la hipótesis nula no se puede rechazar al nivel de confianza del 95%;

p<0,10, se rechaza la hipótesis nula al nivel de confianza del 90%. p>0,10, la hipótesis nula no se puede rechazar al nivel de confianza del 90%.

Rechazar la hipótesis nula en este ejemplo significa que el coeficiente de correlación de Pearson es significativamente diferente de 0.

Marca de significancia, vacío no es significativo *Cuanto más significativo sea al 90%, es diferente de 0 **95% ***99%

SPSS es muy conveniente para el análisis de correlación.

Supongo que te gusta

Origin blog.csdn.net/l203018/article/details/131617798
Recomendado
Clasificación