Resumen de estadísticas de investigación científica

1. Gráficos estadísticos comunes

Las condiciones aplicables y ejemplos de gráficos estadísticos de uso común son los siguientes:

Por ejemplo: el diagrama de dispersión es adecuado para mostrar la relación entre dos variables; el histograma es adecuado para mostrar la distribución de variables continuas, juzgar si se ajusta a la distribución normal, etc.; el diagrama de caja que muestra la mediana y el cuartil de un conjunto de datos Información como el número de dígitos, el valor máximo y el valor mínimo se pueden utilizar para analizar la distribución de datos o si hay valores atípicos, etc.

2. Dibujar ideas

En primer lugar, distinga el tipo de datos: dibujar una imagen generalmente refleja la relación entre X e Y. Entonces primero necesita saber cuáles son los tipos de datos de X e Y respectivamente. A continuación se resume una descripción de la tabla de la siguiente manera:

De acuerdo con el pensamiento de X e Y, primero identifique los tipos de datos respectivos de X e Y, y luego encuentre un gráfico estadístico adecuado para dibujar.
Ejemplo: por ejemplo, si desea analizar la diferencia en el rendimiento del arroz con diferentes variedades y diferentes métodos de fertilización, espera mostrar la diferencia de manera intuitiva a través de gráficos. Es obvio que las dos X aquí son datos cualitativos, mientras que el rendimiento del arroz son datos cuantitativos, por lo que el "diagrama de conglomerados" se puede utilizar para el análisis visual.
Cargue los datos al sistema SPSSAU, seleccione "Gráfico de conglomerados", arrastre la variable al cuadro de análisis correspondiente a la derecha y opere como se muestra en la siguiente figura:

El resultado del diagrama de conglomerados es el siguiente:
 

Gráfico de líneas agrupadas

Gráfico de columnas agrupadas

Gráfico de barras agrupadas


SPSSAU proporciona actualmente un total de 30 tipos de gráficos, que se generan automáticamente con varios métodos. Por supuesto, hay algunos gráficos complejos o especiales que debe dibujar usted mismo.

3. SPSSAU traza automáticamente

Al usar SPSSAU para el análisis de datos, al seleccionar el método correspondiente para analizar y obtener los resultados del análisis, SPSSAU generará automáticamente los resultados del análisis del gráfico estadístico correspondiente de forma predeterminada.
Ejemplo 1: al clasificar los datos para el análisis de frecuencia , SPSSAU generará el gráfico circular, el gráfico de anillos, el histograma y el gráfico de barras correspondientes de forma predeterminada. Si necesita cambiar entre diferentes gráficos estadísticos, haga clic en la esquina superior derecha del gráfico para seleccionar, como se muestra a continuación:


Ejemplo 2: cuando se usa la prueba t de muestra independiente para estudiar la diferencia en la caída de la glucosa en sangre en ayunas entre diferentes grupos, SPSSAU generará el histograma, el gráfico de barras y el gráfico de líneas correspondientes de manera predeterminada. Como se muestra abajo:

Ejemplo 3: cuando se utiliza la prueba de chi-cuadrado para estudiar la diferencia en el efecto del tratamiento de diferentes terapias, SPSSAU generará el gráfico de columnas apiladas correspondiente, el gráfico de barras apiladas, etc. de forma predeterminada, como se muestra en la siguiente figura:

Sugerencias: la visualización de SPSSAU combina la idea de los métodos de análisis de datos y proporciona una visualización gráfica visual precisa de forma predeterminada, que es una parte integral del sistema inteligente de SPSSAU. Por lo general, la primera salida del gráfico estadístico automáticamente es la óptima, es decir, la más adecuada.

En cuarto lugar, la descripción detallada del gráfico estadístico.

1. Diagrama de dispersión

El gráfico de dispersión se utiliza para investigar la relación entre datos cuantitativos, es decir, para ver la relación entre X e Y. Los diagramas de dispersión se utilizan a menudo en la investigación exploratoria para mostrar visualmente la relación entre los datos.

  • Utilice el escenario
    (1) Antes del análisis de correlación, verifique la relación entre X e Y.
    (2) Prueba del modelo después del análisis de regresión, verifique la correlación entre los residuos y las variables independientes [el modelo de regresión asume que los residuos no deben estar correlacionados con las variables independientes, es decir, heteroscedasticidad].
    (3) Otros escenarios para mostrar visualmente las relaciones de datos.
  • Ejemplo de diagrama de dispersión

2. Histograma


El histograma se utiliza para mostrar visualmente la distribución de datos, observar las características de distribución normal de los datos y probar si los datos cumplen con la normalidad.

  • Escenas a utilizar

(1) Durante el análisis de correlación, verifique la normalidad de los datos; (2) Después del análisis de regresión, se verifica el modelo y se prueba la normalidad del residual. Si el residual muestra normalidad, significa que el modelo está bien construido. de lo contrario, significa que el modelo está mal construido. (3) Otros escenarios para ver la distribución de datos, probar la normalidad, etc.

  • Visualización de histograma

3. Diagrama de caja

El diagrama de caja (también conocido como diagrama de caja, diagrama de caja, etc.) fue inventado por el estadístico estadounidense John Tukey en 1977, y los datos del análisis deben ser datos cuantitativos. A través del diagrama de caja, puedes explorar intuitivamente las características de los datos .

  • Escenas a utilizar

(1) Comprobar posibles datos atípicos; (2) Comprobar la distribución de datos de Y al comprobar diferentes categorías de X durante las pruebas no paramétricas; (3) Otros implican comprobar la distribución de datos o comprobar valores atípicos.

  • Visualización de histograma

4. Mapa de nube de palabras

El mapa de nube de palabras fue propuesto por Rich Gordon, profesor de periodismo en la Universidad de Northwestern en los EE. UU. La "nube de palabras" puede resaltar visualmente las "palabras clave" que aparecen con frecuencia en el texto , formando una "nube de palabras clave" o "representación de palabras clave". Para que el espectador pueda comprender la esencia del texto siempre que eche un vistazo al texto.

  • Escenas a utilizar

(1) Intuitivamente mostrar información de texto y resaltar información clave;

(2) Visualización de nube de palabras para información de datos ponderados.

  • Visualización de nube de palabras

5. Gráfico de barras de error

Los diagramas de barras de error se utilizan para ilustrar el grado de incertidumbre en los datos, mostrando el error potencial o el grado de incertidumbre para cada indicador de datos . La fluctuación de los datos de la muestra se refleja en la desviación estándar, por lo que el grado de incertidumbre de la media de la muestra es la desviación estándar.

  • Pantalla de gráfico de barras de error

6. Mapa PP/mapa QQ

El diagrama PP y el diagrama QQ se utilizan a menudo para verificar visualmente si los datos se distribuyen normalmente . Los propósitos del gráfico PP y el gráfico QQ son básicamente los mismos, pero existen diferencias en principio.

  • Escenas a utilizar

(1) Juicio sobre si el valor de Y correspondiente al análisis de varianza tiene características de normalidad; (2) Antes del análisis de regresión, si el valor de Y correspondiente tiene características de normalidad; después del análisis de regresión, use el diagrama PP y el diagrama QQ para verificar el residual Si el valor tiene normalidad; (3) Si el valor residual después de la regresión binaria Logit tiene normalidad. (4) Otros escenarios utilizados para demostrar visualmente la normalidad de los datos.

  • Visualización de gráfico PP/gráfico QQ

7. Curva ROC

La curva ROC, también conocida como curva característica operativa del receptor ; la curva ROC se usó originalmente en el ejército y actualmente se usa ampliamente en el campo médico para estudiar la precisión de la predicción de X para Y.

  • Visualización de la curva ROC

8. Diagrama de cuadrante

Los gráficos de cuadrantes proporcionan una representación visual de la categorización de datos ; se utilizan líneas divisorias horizontales y verticales para dividir el área del gráfico en cuatro cuadrantes, y cada cuadrante presenta los datos correspondientes. En general, el propósito de la presentación del diagrama de cuadrante es mostrar directamente el área de división de datos .

  • Pantalla de cuadrante

9. Diagrama de Pareto

El diagrama de Pareto es una representación gráfica del "principio 28". El 80 % de los problemas son causados ​​por el 20 % de las razones; por lo general, el diagrama de Pareto se puede usar para mostrar la proporción de un determinado "problema" .

  • Visualización del diagrama de Pareto

10. Diagrama de conglomerados

A partir de los tipos de gráficos que se muestran, los gráficos agrupados se pueden dividir en gráficos de líneas agrupados, gráficos de columnas agrupados y gráficos de barras agrupados, etc. . En el diagrama de conglomerados, si los datos de clasificación son 0, 1 o 2, SPSSAU proporciona la visualización gráfica correspondiente.

  • Visualización del diagrama de conglomerados

11. Diagrama de combinación

El gráfico de combinación se usa para visualización gráfica cuando hay una gran diferencia entre los dos tipos de valores de dimensión . Tiene dos ejes de coordenadas, el eje principal y el eje secundario. Por lo general, el eje principal es el artículo con una gran cantidad, y el eje secundario es el artículo con una cantidad relativamente grande artículo grande. Por ejemplo, para mostrar el PIB y la tasa de crecimiento del PIB, el eje principal es el PIB y el eje secundario es la tasa de crecimiento del PIB.

  • Visualización de gráfico combinado

12. Gráfico de burbujas

Los gráficos de burbujas se pueden usar para mostrar la relación entre X e Y, y usar Z para identificar el tamaño de la burbuja en cada punto . Al mismo tiempo, SPSSAU admite la visualización de "etiquetas" directamente en las burbujas, y se pueden usar diferentes colores para identificar las burbujas.
 

  • Visualización de gráfico de burbujas

13. Mapa de densidad del kernel

El mapa de densidad kernel es un método de prueba no paramétrico, que es una abstracción adicional del histograma, pero es más intuitivo y su área bajo la curva es 1. Por lo general, se usa para la visualización de datos continuos, como la distribución de edad, distribución de altura, etc.

  • Visualización del mapa de densidad del kernel

14. Diagrama de violín

El violín es una colección de diagramas de caja y diagramas de densidad kernel , que pueden mostrar los diversos puntos percentiles de los datos a través del pensamiento de caja. Al mismo tiempo, el diagrama de densidad kernel también se puede usar para mostrar el efecto de "contorno" de los datos. distribución, "contorno" Cuanto mayor sea el valor, más concentrados estarán los datos en ese lugar, y viceversa, menos datos habrá.

  • Visualización del diagrama de violín

Supongo que te gusta

Origin blog.csdn.net/m0_37228052/article/details/132089963
Recomendado
Clasificación