Hablando de pronósticos de series de tiempo

El siguiente contenido es un resumen parcial de la lectura de los artículos técnicos de Yuanguan Data Boss. Consulte el texto original: Hablando de pronósticos de series temporales - Artículo de byte - Zhihu zhuanlan.zhihu.com/p/486343380

1. Prueba de efecto

  • Métrica insensible a la dimensión numérica:

    • SMPAE (MAPE simétrico):

      • S M A P E = 1 n t = 1 n F t A t ( A t + F t ) / 2 SMAPE=\frac{1}{n}\sum_{t=1}^{n}\frac{|F_t-A_t|}{(A_t+F_t)/2}

      • MAE en representación porcentual

      • Tiene límite superior (200%) inferior (0%)

    • WMAPE (MAPE ponderado):

      • W M A P E = t = 1 n A t F t t 1 n A t WMAPE=\frac{\sum_{t=1}^{n}|A_t-F_t|}{\sum_{t-1}^n|A_t|}

      • Evaluar los errores de diferentes órdenes de magnitud de manera equivalente

      • Resolver para MAPE Dividir por cero

2. Clasificación de modelos

2.1 Métodos tradicionales

  • MA (promedio móvil, que toma el promedio de las observaciones en los últimos n puntos de tiempo como el pronóstico para el siguiente punto):

    • Ventajas: rápido, funciona bien como base.
    • Desventajas: no se pueden realizar varios pasos y hay un problema de retraso.
  • ARIMA (Media Móvil Autorregresiva):

    • Pros: más fuerte que el ajuste MA y AR
    • Desventajas: búsqueda de parámetros, tiempo de ejecución prolongado, necesidad de predecir cada secuencia por separado.
  • Prophet (modelo aditivo de descomposición secuencial):

    • Ventajas: las tendencias no lineales no tienen ninguna ventaja en las variables externas estacionales y pueden generar probabilidades.
    • Desventajas: predicción de secuencia única, laboriosa a gran escala.
  • Otros: Orbit y NeuralProphet, no tan buenos.

  • defecto:

    • Hay algunos requisitos de naturaleza para el tiempo en sí, no para la optimización de extremo a extremo;
    • Solo se puede hacer una predicción de secuencia única y la sobrecarga de rendimiento es alta.
    • Autorregresivo, no se pueden introducir covariables.
    • La predicción de varios pasos no funciona.

2.2 Métodos de aprendizaje automático

  • Modelado

    • Problemas de la tabla de conversión de series de tiempo

  • ingeniería de funciones

    • Las nuevas funciones se construyen de acuerdo con diferentes tipos de funciones, y la parte de preprocesamiento no se trata aquí.

    • Herramienta automática de ingeniería de funciones de series temporales: tsfresh (según otros documentos, la automatización completa no es lo suficientemente inteligente, generará muchas funciones y puede explotar la memoria)

    • Introducción a otros métodos de funciones de series temporales: zhuanlan.zhihu.com/p/67832773

  • Modelo

    • GBDT:

      • lightGBM, fastai (Optuna o FLAML se pueden usar para el ajuste automático de parámetros)
      • La expresión de las características comerciales es mejor que NN
    • NN:

      • El aprendizaje de expresiones variables categóricas tendrá una mejor integración
      • diseño de pérdida flexible
      • El aprendizaje multiobjetivo es más conveniente que los modelos de árbol.

2.3 método DL

  • RNN (RNN, LSTM, GRU)
  • Seq2Seq (forma combinada RNN)

- 以RNN组件作为基本单元,encoder中做训练窗口的信息提取,decoder中做预测的多部输出。
- 评估:效果一般,计算开销大,稳定性不行,误差分析和模型解释难做。
复制代码
  • WaveNet (convolución causal atrosa)

-   比RNN好并行,使用一维CNN做序列预测,还加入residual connection和skip connection和一系列复杂的门机制。
-   评估:没RNN好用
复制代码
  • LSTNet

-   评估:不如特征工程+fastai
复制代码
  • DeepAR

-   Seq2Seq形式,但是能输出概率分布。
-   评估:难以稳定收敛,精度波动大,效果比不过GBDT。
复制代码
  • N-latidos

-   单变量预测,有一定的季节和趋势解释性。
-   评估:效果一般,不好加额外的特征变量。
复制代码
  • TFT

-   能和树模型叫板的DL模型,跟树模型有一定近似性,有特征变量选择网络。
-   评估:有点意思,由于其拟树形式的原理,效果稳定不少,但计算开销还是比较大。
复制代码
  • Resumen :

    • En la actualidad, el efecto de GBDT es aún mejor que DL a gran escala.
    • Los puntos fuertes de DL incluyen pre-entrenamiento, aprendizaje de transferencia y aprendizaje de representación, y los modelos generativos son difíciles de usar en el campo de series temporales.

2.4 Temporización AutoML

  • Bibliotecas:

    • Auto_TS
  • Método convencional:

    • Ingeniería de características + GBDT
    • La interfaz de conjunto de datos de tiempo estructurado TFT es factible para la ingeniería automática de características.

\

Supongo que te gusta

Origin juejin.im/post/7078582980091838501
Recomendado
Clasificación