Proceso y método de pronóstico (Capítulo 3 de Pronóstico: Principios y práctica)

  1. La caja de herramientas del pronosticador
    3.1: un flujo de trabajo de pronóstico ordenado
    genera pronósticos de datos de series de tiempo que se pueden dividir en los siguientes pasos:
    Inserte la descripción de la imagen aquí

Preparación de datos (organización) El
método de preparación de datos también se puede utilizar para explorar las diferentes características de las series de tiempo; el preprocesamiento del conjunto de datos es un paso importante para evaluar el rendimiento del modelo mediante la validación cruzada.

Trazado de datos (visualización)

Definir el modelo (especificar)
Antes de ajustar el modelo a los datos, primero debemos describir el modelo. Existen muchos modelos de series de tiempo diferentes que se pueden usar para pronosticar, y especificar el modelo apropiado para los datos es crítico para generar pronósticos apropiados.

Capacite el modelo (estimación)
Para cada combinación de variables clave en la variable lineal, esto ajusta el modelo de tendencia lineal a los datos del PIB. En este ejemplo, se ajustará el modelo a 263 países en el conjunto de datos. El objeto generado es una tabla modelo o "mable".

Verifique el rendimiento del modelo (evaluación) Después de
ajustar el modelo, es importante verificar el rendimiento del modelo en los datos. Existen varias herramientas de diagnóstico que se pueden utilizar para verificar el comportamiento del modelo, y hay algunas medidas de precisión que pueden comparar un modelo con otro.

Generar pronóstico (pronóstico)

3.2 Algunos métodos de pronóstico simples
Método promedio El pronóstico de
todos los valores futuros es igual al promedio de los datos históricos (o "promedio").
Inserte la descripción de la imagen aquí

Método ingenuo ( predicción de caminata aleatoria )
Para la predicción ingenua, solo establecemos todas las predicciones al valor de la última observación.
Inserte la descripción de la imagen aquí
Para muchas series de tiempo económicas y financieras, este método es muy efectivo.
Predicción de caminata aleatoria (método Naïve) : establezca todas las predicciones en el valor de la última observación, porque la predicción de Naive es mejor cuando los datos siguen la caminata aleatoria (ver Sección 9.1)
Inserte la descripción de la imagen aquí

Método ingenuo estacional
Para datos altamente estacionales , también son útiles métodos similares. En este caso, establecemos cada pronóstico igual a la última observación en la misma estación del año (por ejemplo, el mismo mes del año pasado) . Formalmente, la predicción del tiempo.
Inserte la descripción de la imagen aquíInserte la descripción de la imagen aquí

El método de deriva
es una forma de cambiar el método ingenuo, es permitir que la predicción aumente o disminuya con el tiempo. La magnitud de este cambio en el tiempo se puede establecer en el cambio promedio en los datos históricos.
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí
A veces, uno de estos métodos simples estará disponible El mejor método de predicción. Pero en muchos casos, estos métodos servirán como un punto de referencia en lugar de un método de elección. En otras palabras, cualquier método de predicción que desarrollemos se comparará con estos métodos simples para garantizar que el nuevo método sea mejor que estos métodos simples. Si este no es el caso, entonces no vale la pena considerar el nuevo método. Este método se ha aplicado al precio de cierre diario de Google en 2015 y se usa para predecir el precio en el próximo mes. Dado que el precio de las acciones no se observa todos los días, primero creamos un nuevo índice de tiempo basado en el día de negociación en lugar del día calendario.

3.3 transformación y ajustes
4 formas de ajustar los datos históricos:
1) Ajuste del calendario
2) Ajuste de la población
3) Ajuste de la inflación
4) El
propósito de la conversión de datos es simplificar eliminando las anomalías conocidas o haciendo que el patrón sea coherente en todo el conjunto de datos Patrones en datos históricos, porque patrones simples pueden conducir a predicciones más precisas

Ajustes de calendario
Algunos cambios en los datos estacionales pueden deberse a simples efectos de calendario, por lo que debe eliminar las diferencias antes de ajustar el modelo de predicción.
Ej: Al estudiar las ventas mensuales totales de las tiendas minoristas, habrá diferencias entre los meses, debido a que además de los cambios estacionales a lo largo del año, la cantidad de días mensuales de negociación también es diferente. Al calcular el promedio de ventas para el día de negociación de cada mes en lugar de las ventas totales del mes, esta diferencia se puede eliminar fácilmente, eliminando efectivamente los cambios de calendario.

Ajuste demográfico
Cualquier dato afectado por los cambios demográficos puede ajustarse para proporcionar datos per cápita, es decir, considerando los datos de cada persona en lugar del total.
Por ejemplo: al estudiar la cantidad de camas en un área específica a lo largo del tiempo, es más fácil explicar la cantidad de camas por cada 1,000 personas para eliminar el impacto de los cambios en la población. Para la mayoría de los datos afectados por cambios demográficos, es mejor usar datos per cápita en lugar de totales.

Ajuste de la inflación Los
datos afectados por el valor de la moneda deben ajustarse antes de modelar
Ej: el costo promedio de una nueva casa ha aumentado en las últimas décadas debido a la inflación; por lo tanto, ajustando las series de tiempo financieras para que todos los valores sean específicos El valor en dólares del año.
Inserte la descripción de la imagen aquí

Transformaciones matemáticas Las transformaciones
pueden ser útiles si los datos muestran cambios a medida que el nivel de la serie aumenta o disminuye.
Ej: la transformación logarítmica es útil si el valor de observación original es Inserte la descripción de la imagen aquí.
, Entonces el valor de observación convertido Inserte la descripción de la imagen aquí.
La efectividad del logaritmo radica en su interpretabilidad . El cambio en el valor logarítmico es el cambio relativo (o porcentaje) en la relación original; por lo tanto, si se utiliza una base logarítmica de 10, un aumento de 1 en la escala logarítmica corresponde al producto de 10 en la escala original. Otra función útil de la transformación logarítmica es que limitan la predicción a permanecer positiva en el rango original.
A veces, otras transformaciones también son útiles, como la raíz cuadrada o la raíz cúbica, se llaman transformaciones de potencia porque se escriben comoInserte la descripción de la imagen aquí

La transformación de Box-Cox incluye la transformación de potencia y la transformación logarítmica, y depende del parámetro lambda, se puede definir como:
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí

Un buen λ es un método para hacer que la variación estacional de toda la serie sea aproximadamente la misma, ya que puede simplificar el modelo de predicción. En este caso, λ = 0.10 funciona bien, aunque λ obtendrá resultados similares entre 0 y 0.2.

Después de seleccionar la conversión antes, necesitamos predecir los datos convertidos. Entonces, necesitamos transformar inversamente (o transformar hacia atrás) para obtener la predicción de la relación original. La transformación inversa de Box-Cox viene dada por:
Inserte la descripción de la imagen aquí

Características de la conversión de potencia
 Si algunos yt ≤ 0, no puede utilizar la conversión de potencia a menos que todos los valores se incrementen por una constante para que sea positiva
 Elija un λ simple para que sea más fácil de interpretar
λ λ es relativamente predictivo Insensibilidad
 Usualmente no se requiere
conversión conversion La conversión a veces tiene poco efecto en la predicción, pero tiene una gran influencia en el intervalo de predicción.

Combinaciones de conversión La combinación de
conversiones amplía la forma en que la variable dependiente puede modificarse sustancialmente. La transformación Box-Cox (λ ≠ 0) se puede descomponer en varias transformaciones más simples (multiplicación, suma y operaciones de potencia).
Por ejemplo: la transformación logarítmica garantiza que la predicción resultante no sea negativa, lo cual es particularmente atractivo para restringir datos razonables .
Sin embargo, la conversión logarítmica no puede usarse para datos con observaciones 0 (o negativas); en cambio, log (x + 1) puede usarse para la conversión logarítmica de datos que contienen 0, y la mayoría de las combinaciones de conversiones pueden usarse de esta manera Dijo.

Se puede utilizar otro logit útil para el escalado del tiempo de conversión para garantizar que las predicciones se mantengan dentro de un cierto intervalo de tiempo. Un logit escalado asegura que el valor predicho esté en el rango de ayb (a <b).
Inserte la descripción de la imagen aquí
Revertir esta conversión permite una conversión inversa apropiada:
Inserte la descripción de la imagen aquí
al definir esta nueva función de conversión, ahora es posible limitar la predicción al intervalo especificado . Por ejemplo, para limitar la predicción a entre 0 y 100, puede usar scaled_logit (y, 0, 100) como la fórmula en el lado izquierdo del modelo.

Ajuste de desviación El problema de
usar una transformación matemática (transformación box-cox): la predicción puntual de la transformación inversa no es la media de la distribución predicha, generalmente la mediana de la distribución predicha.
Para muchos pronósticos, esto es aceptable, pero a veces es necesario usar pronósticos promedio, como esperar agregar pronósticos de ventas de varias regiones para formar pronósticos para todo el país, pero la mediana no se sumará y el promedio sí lo hará.
Para la transformación de Box-Cox, el valor medio después de la transformación inversa viene dado por la siguiente fórmula:
Inserte la descripción de la imagen aquí
Aquí Inserte la descripción de la imagen aquíestá la varianza predicha del paso h convertido: cuanto mayor sea la varianza predicha, mayor será la diferencia entre la media y la mediana.

La diferencia entre el pronóstico de transformación inversa simple anterior y el pronóstico de transformación inversa promedio se llama sesgo; cuando usamos el promedio en lugar de la mediana, decimos que el pronóstico puntual se ha ajustado por sesgo.
Inserte la descripción de la imagen aquí

La línea azul en la Figura 3.5 muestra la mediana pronosticada y la línea roja muestra la media pronosticada. Tenga en cuenta que cuando usamos el ajuste de sesgo, ¿cómo la distribución de pronóstico sesgada levanta el pronóstico puntual?

3.5 valores ajustados y valores ajustados residuales
: use todas las observaciones anteriores para predecir cada valor de la serie de tiempo, llamamos a estos valores como valores ajustados, y están etiquetados como Inserte la descripción de la imagen aquí, lo que significa que el valor pronosticado yt se basa en las observaciones Inserte la descripción de la imagen aquí, generalmente El valor ajustado siempre implica predicción de un solo paso.

Residuos Los residuales en el
modelo de serie temporal son los residuales que quedan después de ajustar el modelo; para la mayoría de los modelos de series temporales, los residuales son iguales a la diferencia entre el valor observado y el valor ajustado correspondiente.
Inserte la descripción de la imagen aquí
Los residuos son útiles cuando se verifica si el modelo ha capturado adecuadamente la información en los datos. Si se pueden observar patrones en los residuos, se puede mejorar el modelo.

3.5 intervalos de predicción
nos dan la expectativa de que Yt caerá dentro de cierto intervalo con una probabilidad especificada.
Por ejemplo, suponiendo que los residuos se distribuyen normalmente, a continuación, para el 95% de predicción de intervalo de paso h:
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquíla predicción de los criterios de distribución paso diferencia h; términos más generales, podemos ser llamados Inserte la descripción de la imagen aquí
y aquí depende de la cobertura del multiplicador c .

El valor del intervalo de predicción es que representan la incertidumbre en la predicción; si solo se genera la predicción puntual, la precisión de la predicción no puede explicarse, pero si el intervalo de predicción también se genera, entonces puede saber cuánta incertidumbre tiene cada predicción. Por lo tanto, no hay un intervalo de predicción adjunto, y la predicción puntual tiene poco valor.

Intervalo de
pronóstico de un paso Al pronosticar un paso adelante, la desviación estándar de la distribución de pronóstico es casi la misma que la desviación estándar de los residuos.
Ej: Considere el pronóstico ingenuo para los datos del precio de las acciones de Google google_2015 (consulte la Figura 3.3). El último valor de la secuencia de observación es 758.88, por lo que la predicción del siguiente valor de GSP es 758.88. La desviación estándar del método ingenuo es 11.19. Por lo tanto, el intervalo de predicción del 95% para el siguiente valor de GSP es
Inserte la descripción de la imagen aquí


Una característica común de los intervalos de predicción de varios pasos es que su longitud aumenta a medida que aumenta el rango de predicción . Cuanto más pronostiquemos, mayor será la incertidumbre del pronóstico y, por lo tanto, mayor será el intervalo de pronóstico.
En otras palabras, σh generalmente aumenta con h (aunque algunos métodos de predicción no lineales no tienen esta propiedad).

Para generar el intervalo de predicción, es necesario estimar σh; para la predicción de un solo paso (h = 1), la desviación estándar residual puede ser una buena estimación de la desviación estándar de predicción; para la predicción de varios pasos, se requiere un método más complicado, estos cálculos suponen residual Es irrelevante

Método de referencia
Para los siguientes cuatro métodos de referencia, la desviación estándar de la predicción puede derivarse matemáticamente bajo el supuesto de que los residuos no están correlacionados .
Inserte la descripción de la imagen aquí

Intervalo de predicción residual bootstrap
Cuando la distribución normal de residuos es una suposición irracional , un método alternativo es utilizar el método bootstrap, que solo supone que los residuos no son relevantes .
Paso de error de predicción se define como: Inserte la descripción de la imagen aquí; podemos escribir a Inserte la descripción de la imagen aquí; a continuación, se puede simular la serie de tiempo observado es el siguiente paso: Inserte la descripción de la imagen aquíHe aquí Inserte la descripción de la imagen aquíun valor predictivo paso, y Inserte la descripción de la imagen aquíel error futuro desconocido. Suponiendo que los errores futuros son similares a los errores pasados, entoncesPodemos hacer esto muestreando el conjunto de errores del pasado (es decir, residuales)Para añadir un nuevo valor de medición analógico a nuestro conjunto de datos, podemos repetir el proceso se ha Inserte la descripción de la imagen aquí
realizado de manera repetida, podemos obtener una gran cantidad de futuros posibles. Luego, podemos calcular el intervalo de predicción calculando el percentil de cada rango de predicción. El resultado se llama intervalo de predicción de arranque . El nombre "bootstrap" se refiere al uso de bootstraps para mejorar nuestras habilidades, porque este proceso nos permite usar solo datos históricos para medir la incertidumbre futura.
Inserte la descripción de la imagen aquí

Intervalo de predicción y transformación
Si se ha utilizado la conversión , el intervalo de predicción debe calcularse en la escala convertida, y los puntos finales deben convertirse inversamente para dar el intervalo de predicción en la escala original. Este método conserva la cobertura de probabilidad del intervalo de predicción , aunque ya no es simétrico alrededor de la predicción puntual.

Publicado 69 artículos originales · elogiado 11 · 20,000+ visitas

Supongo que te gusta

Origin blog.csdn.net/weixin_41636030/article/details/102853708
Recomendado
Clasificación