Dibujo y análisis estadístico de datos del bioma (ecológico) en lenguaje R (desde la clasificación de datos hasta la visualización de los resultados del análisis)

Las funciones gratuitas, gratuitas y de código abierto del lenguaje R hacen que se utilice ampliamente en el análisis estadístico de los datos del bioma. Los datos del bioma son diversos y complejos, e involucran numerosos métodos de análisis estadístico. Tomando como línea principal los métodos estadísticos más utilizados en el análisis de datos de comunidades biológicas, tales como modelos de regresión y de efectos mixtos, técnicas de análisis estadístico multivariado y ecuaciones estructurales, a través de una serie de ejemplos de estudios clásicos, la implementación del lenguaje R de cada método se describe en detalle Formas (ver contenido didáctico para más detalles). Centrándose en el campo de la investigación ecológica, desde la operación básica y el dibujo del lenguaje R, la preparación y clasificación de datos, hasta el análisis de escenarios de aplicación de varios métodos de análisis cuantitativo, para realizar el proceso completo de análisis de datos de investigación científica desde la clasificación de datos hasta la visualización de los resultados del análisis. , se combinaron los "Conceptos básicos del lenguaje R", "Limpieza de datos tidyverse", "Análisis estadístico multivariado", "Modelo de bosque aleatorio", "Modelo de regresión y efectos mixtos", "Modelado de ecuaciones estructurales" y "Gráfica de resultados estadísticos" (7 en 1).

Tema 1: Introducción a R y Rstudio y conceptos básicos para comenzar y dibujar

1) Introducción a R y Rstudio: antecedentes, instalación de software y paquetes, configuración básica, etc. lectura de archivos Adquisición, clasificación y almacenamiento, etc.a 4) Dibujo básico en lenguaje R (incluido ggplot): dibujo básico, composición tipográfica, almacenamiento de salida de dibujo con calidad de publicacióna

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 2: limpieza de datos en lenguaje R: aplicación del paquete tidyverse

1) introducción ordenada: tidyr, dplyr, readr, %>%, etc.

2) Operación de archivos: lea archivos en diferentes formatos, lea varios archivos al mismo tiempo, etc.

3) Filtrado de datos: filtrado de filas, filtrado de columnas, filtrado condicional (manipulación de caracteres), etc.

4) Generación de datos: fusión de datos, división de datos, generación de nuevos datos (manipulación de personajes), etc.

5) Conversión de datos de largo y ancho, llenado y borrado de valores nulos (NA), agrupación, clasificación y resumen, etc.

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 3: Preparación de datos comunitarios y análisis de exploración

1) Preparación de datos de biomas: composición de especies, variables ambientales, atributos funcionales de especies, árboles filogenéticos, etc.

2) Inspección de datos de bioma: valores faltantes y valores atípicos (outliers), etc. - para evitar errores de modelo (GIGO)

3) Cálculo de la diversidad de especies: diversidad de especies (TD), diversidad funcional (FD) y diversidad filogenética (PD)

4) Introducción de la medida de asociación de la matriz de similitud/disemejanza de especies

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 4: Clasificación sin restricciones de datos comunitarios - PCA, CA, PCoA, NMDS

1) Introducción al análisis de clasificación sin restricciones de datos de bioma

2) Clasificación de datos de hábitat de peces del caso 1: PCA

3) Clasificación de datos de composición de especies de aves en el caso 2: comparación de CA, PCoA y NMDS

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 5: Clasificación de restricciones de datos comunitarios - RDA, dbRDA, CCA, 4th Corner

1) Introducción a la clasificación restringida de datos de bioma: clasificación restringida asimétrica VS clasificación restringida simétrica

2) Interpretación de la distribución de la comunidad de polillas de los factores de paisaje, parche y hábitat en el Caso 1: selección de RDA, dbRDA o CCA + descomposición de la variación

3) Especies del caso 2 con o sin (0, 1) clasificación de restricción de datos: dbRDA

4) Análisis de correlación de la composición de las especies, los atributos de las especies y los factores ambientales en el Caso 3 - Análisis de la 4.ª esquina (4.ª esquina)

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 6: Análisis grupal de datos comunitarios: agrupamiento jerárquico/no jerárquico (HC/NHC), PERMANOVA, etc.

1) Descripción general de la agrupación y el análisis de diferencias de los datos del bioma

2) Agrupamiento jerárquico y no jerárquico de datos de hábitat de aves en el caso 1: KMEANS y HCLUST

3) Caso 2 Test de diferencias en hábitat adecuado para tortugas (comparación de dos grupos) e interpretación: PERMANOVA, MRPP, ANOSIM y Dispersion test

4) Análisis de las diferencias de composición microbiana bajo gradientes ambientales en el caso 3 (comparación de múltiples grupos) e interpretación: MRPP y Dispersion Test

5) Caso 4 Efectos de las drogas en la microflora intestinal: PCoA+PERMANOVA

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 7: Modelo de bosque aleatorio de datos comunitarios (Bosque aleatorio) - Clasificación VS Regresión

1) Introducción al modelo de bosque aleatorio

2) Proceso básico de análisis de modelo de bosque aleatorio - clasificación VS regresión

3) Caso 1 Clasificación aleatoria de bosques y selección de variables importantes: clasificación RFM

4) Caso 2 Modelo de regresión de bosque aleatorio y evaluación de importancia variable: regresión RFM

5) Caso 3 La relación entre los atributos morfológicos multidimensionales y los atributos ecológicos de las especies: un caso completo de PCA+PCoA+LDA+RFM

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 8: Modelo Lineal General (lm)

1) Forma básica, suposiciones básicas, métodos de estimación, prueba de parámetros, prueba de modelos

2) Análisis de regresión, varianza y covarianza de diferentes velocidades de natación de peces en el Caso 1

3) Caso 2 Determinantes de la diversidad de peces herbívoros marinos - validación del modelo

4) Detección de factores ambientales para la abundancia de peces de agua dulce en el caso 3: regresión por pasos (selección del modelo)

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 9: Modelo Lineal Generalizado (glm)

1) Principios básicos, pasos de modelado y proceso del modelo de efectos mixtos lineales generalizados

2) Modelo logístico con o sin (0, 1) datos en el caso 1 - distribución binomial

3) Caso 2 Relación entre la edad de las focas y el comportamiento agresivo - 0, 1 datos transformados en análisis de datos de proporción

4) Caso 3 Interpretación ambiental de la distribución de abundancia de especies - datos de conteo Poisson, binomial negativo, inflación cero, modelo de truncamiento cero

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 10: Modelo Lineal de Efectos Mixtos (lmm)

1) El principio básico del efecto mixto y el proceso básico, los pasos y la realización del análisis.

2) Caso 1 Datos jerárquicos determinantes de la diversidad de especies - proceso de construcción del modelo, predicción y diagnóstico del modelo

3) Caso 2: comparaciones múltiples en un experimento multivariante (datos estratificados)

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 11: Modelo Lineal Generalizado de Efectos Mixtos (glmm)

1) Principios básicos, pasos de modelado y proceso del modelo de efectos mixtos lineales generalizados

2) Análisis multivariado-modelo logístico de efectos mixtos del caso 1 renacuajo "metamorfosis" o no (0, 1)

3) Análisis multivariante de los factores que afectan la abundancia de semillas insectívoras en el caso 2 - Modelo de efectos mixtos de Poisson

4) Análisis de modelo de efectos mixtos lineales generalizados de datos de conteo y selección de modelo: modelos de Poisson, pseudo-Poisson, binomial negativo, Poisson inflado en cero, binomial negativo inflado en cero, Poisson truncado en cero y binomial negativo truncado en cero

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 12: Regresión de correlación espacial, temporal y filogenética - análisis de autocorrelación de datos (autocorrelación)

1) Introducción a los problemas de autocorrelación de datos: Introducción al tiempo, espacio y filogenia

2) Corrección de autocorrelación espacial del patrón de distribución de la diversidad de plantas forestales en el Caso 1

3) Corrección de la autocorrelación temporal de la abundancia de aves en diferentes años en el Caso 2

4) Caso 3: El papel de la correlación filogenética en el análisis de la distribución de la abundancia de camarones

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema Trece: Modelado de Ecuaciones Estructurales (SEM): lavaan y piecewiseSEM-efectos directos e indirectos multivariados y causalidad

1) Introducción al modelado de ecuaciones estructurales: definición, historia, aplicación, método de estimación, reglas identificables del modelo y requisitos de tamaño de muestra, etc.

2) Los efectos directos e indirectos de la restauración de la riqueza de especies de la comunidad en el caso 1: el proceso básico del análisis SEM-lavaan vs piecwiseSEM

3) Caso 2 Efectos de la heterogeneidad ambiental y la disponibilidad de recursos sobre la diversidad de plantas vasculares del sotobosque en diferentes etapas sucesionales: ajuste del modelo, comparación, evaluación y presentación de resultados

4) Caso 3 Contribuciones relativas de las actividades humanas, las condiciones ambientales y los atributos de las especies al tamaño del dominio animal (roles relativos): modelo mixto, estructura anidada, análisis de grupo e implementación SEM de variables de clasificación

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Tema 14: Gráficos de resultados de análisis estadísticos y datos comunitarios (ggplot), composición tipográfica y salida de mapas de calidad de publicación

1) Datos de la comunidad y preparación de datos de mapeo de resultados de análisis estadístico: extracción de resultados y arreglo de datos de mapeo

2) Análisis de conglomerados y gráfico de prueba de diferencia de grupo: mapa de resultados de conglomerados, mapa de calor (mapa de calor), mapa de resultados de prueba de diferencia de grupos

3) Diagramas de clasificación sin restricciones como PCA, CA, PCoA y NMDS: diagrama de clasificación y biplot

4) RDA, db-RDA y CCA y otros diagramas de clasificación de restricciones: diagrama de secuencia triple (triplot) y diagrama de Venn (venn)

5) Gráficos de resultados de análisis de modelos de regresión y efectos mixtos: diagramas de dispersión, diagramas de caja, histogramas y diagramas de violín, etc.

6) Expresión del diagrama de resultados del modelo de ecuación estructural

Editar alternar al centro

Agregue anotaciones de imágenes, no más de 140 palabras (opcional)

Lectura recomendada:

Regresión en lenguaje R y modelo de efectos mixtos (multinivel/jerárquico/anidado) e implementación bayesiana

Aplicación práctica del modelado de ecuaciones estructurales (SEM) en lenguaje R en el campo de la ecología

Supongo que te gusta

Origin blog.csdn.net/weixin_58566962/article/details/130934039
Recomendado
Clasificación