GGR376 regresión


GGR376
Tarea 2: Regresión
44 Marcas
de regresión: Modelización de la relación entre una respuesta (o variable dependiente) y una o
más variables explicativas (o variables independientes). regresión lineal es un enfoque lineal para
modelar la relación.
Antes de completar la tarea, revisar el tutorial de rebajas ejemplo R y los videos.
Nota: Unir los datos espaciales al principio, ya que causa problemas para hacerlo al final.
Investigación Problema:
Producir un modelo de regresión se explica por la variación de los costos de vivienda por sección censal en la
ciudad de Hamilton, Ontario, Canadá.
Datos:
límites Hamilton Censal, que incluye el precio medio de la vivienda y el único
identificador: CTUID.
Se puede acceder a los datos con el siguiente comando y la URL:
biblioteca (rgdal)
rgdal :: readOGR ( "https://raw.githubusercontent.com/gisUTM/GGR376/master/Lab_1/houseValu
es.geojson")
Necesitará obtener 10 variables explicativas potenciales de los datos del censo de 2016, disponible
GGR376留学生作业代写
de CHASS: http://dc2.chass.utoronto.ca.myaccess.library.utoronto.ca/census/
formato de asignación:
el envío de una tarea será compuesto de tres archivos.
1. Una secuencia de comandos R de su código producido durante el proyecto, con la extensión .R.
2. Un archivo CSV de los datos de entrada adicionales que utilizó en su modelo (una tabla).
3. Las respuestas a las siguientes preguntas en un archivo PDF.
Los tres archivos deben presentarse en línea.
Requisitos de asignación:
• Asegúrese de que todos los procedimientos del laboratorio tutorial se replican en su trabajo.
• El ajuste y prueba de 10 modelos de regresión lineal.
o Ejemplos de nombres de modelos: Modelo_1, model_2, etc.
o Todos los modelos deben permanecer en el código.
o cambiar el nombre de su modelo final: final_model
• El modelo final debe cumplir con todas las hipótesis con la posible excepción:
o errores independientes debido a la autocorrelación espacial.
▪ Validar el supuesto de errores independiente en su modelo con espacial
modelado autorregresivo.
CALIFICACIÓN
R Guión: 10 Marcas
La secuencia de comandos que envíe deben ser totalmente reproducible, lo que significa que el AT debe ser capaz de ejecutar
la secuencia de comandos sin modificaciones. La única modificación permitida sería la ruta de archivo del
archivo CSV de sus variables de entrada adicionales. Revisar la clasificación en la escala R escritura a continuación.
La estructura general de la secuencia de comandos R debe seguir:
1. Datos Munging:
a. Lectura de datos
b. La fusión de datos
2. Análisis gráfico Pre-Check
3. Transformaciones de los datos
4. Correlación Evaluación
5. Modelo de montaje y evaluación del modelo de hipótesis (10 modelos)
a. Si una suposición se rompe se puede continuar con el siguiente modelo.
yo. No hay necesidad de probar todas las hipótesis en este caso
6. Evaluación espacial Autocorrelación
7. espacial autorregresivo Modelado
R escritura de evaluación:
10/10: El código está bien documentado con comentarios y nombres de variables detalladas. No hay problemas
están presentes en el código. Una persona versada en R debe ser capaz de leer a través del código en un solo
intento.
9/10: El código está bien documentado. Un error, inconsistencia, pobres nombre de variable única o
documentación está presente. Un miembro puede tener que realizar un solo cheque de código anterior a
interpretar.
8/10: El código está documentado. Un par de errores, inconsistencias, nombres de variables pobres o
documentación está presente. Un miembro puede tener que realizar múltiples comprobaciones de código anterior a
interpretar.
7/10: El código está documentado. A pocos errores, inconsistencias, nombres de variables o pobres
documentación está presente. Un miembro tiene que hacer varias comprobaciones de código anterior a
interpretar, pero puede entender todas las secciones del código.
6/10: El código está parcialmente documentada. Errores, inconsistencias y los nombres de variables pobres están
presentes. Un miembro tiene que hacer varias comprobaciones de código anterior para interpretar y no puede
entender completamente todas las secciones del código.
5/10: El código está escasamente documentada. Muchos errores, inconsistencias y los nombres de variables pobres
presentan. Un miembro tiene que hacer varias comprobaciones de código anterior para interpretar y no se
entiende por completo todas las secciones del código.
4 o más adelante: muchas inconsistencias en el código. No sería capaz de reproducirse por otro
investigador sin muchas preguntas dirigidas al autor original.
Missing requisitos de asignación en el código también reducirá su marca.
• Muy pocos modelos lineales en el código (-1 para cada modelo que falta)
• Final_model no se cambia el nombre (-1)
• Supuestos del modelo no probados (-1 para cada supuesto)
• I de Moran no han sido evaluados correctamente (-2)
• Cifrará no se ejecute cuando probado (-3)
• Otros errores serán penalizadas según sea apropiado.
Para lograr una marca superior a 8, lo más probable es que le re-escribir el código después de haber completado
trabajando a través de la asignación de garantizar la claridad.
Archivo CSV: 2 Marcas
El archivo CSV debe contener todas las variables que obtuvo a partir del Censo de ensayos con el
su modelo. Debe contener 10 variables.
Preguntas (32 puntos)
Todas las cifras deben incluir un pie de figura.
1. Complete el siguiente cuadro. (1 Mark)
Nombre de la variable
en el archivo CSV Mín Máx Medio Variable Descripción
2. Complete el siguiente cuadro. (2 puntos)
Nombre de la variable
en CSV Razón de archivos por los que escogió la variable.
3. Producir un histograma calidad de publicación de la variable dependiente (transformado si se hizo una
transformación). (3 puntos)
4. Escribir 50 palabras sobre por qué hizo o dejó de transformar su variable dependiente en base a los
supuestos del modelo de regresión lineal. (2 Marks)
5. Describe en 200 palabras que su proceso de ajuste del modelo. Frente a la selección de variables, cómo
que decidió suprimir o añadir variables y la forma en que evaluaron cada supuesto. (4 puntos)
6. Complete el siguiente cuadro (2 puntos)
Modelo
Nombre R
2
p <0,05
(S / N) Lista supuesto (s) violado o Todos los supuestos reunieron?
7. Para su modelo de regresión lineal final, producen una figura de las 4 parcelas generadas por
parcela (linear_model). (2 Marks)
8. producir una figura de calidad de publicación de los residuos frente a los valores ajustados para su lineal último
modelo de regresión. (3) Marcas
I de Moran 9. Calcular para sus residuos. Informe de 50 palabras, sus valores de I de Moran y cómo
se interpretan estos resultados. (3 puntos)
10. Escribir 150 palabras de interpretación su modelo de regresión lineal final. (4 puntos)
11. ¿Quieres que requiere un modelo autorregresivo espacial? Explica cómo se ha elegido el
modelo a utilizar. (3 puntos)
12. producir un mapa de los residuos de un modelo autorregresivo espacial. (3 puntos)

Si es necesario, añada QQ: 99515681 o por correo electrónico: [email protected] carta micro: codehelp

Supongo que te gusta

Origin www.cnblogs.com/welcomeyou/p/12444129.html
Recomendado
Clasificación