El siguiente contenido es un resumen parcial de la lectura de los artículos técnicos de Yuanguan Data Boss. Consulte el texto original: Hablando de pronósticos de series temporales - Artículo de byte - Zhihu zhuanlan.zhihu.com/p/486343380

1. Prueba de efecto

Métrica insensible a la dimensión numérica:
- SMPAE (MAPE simétrico):
  - $SMAPE=\frac{1}{n}\sum_{t=1}^{n}\frac{|F_t-A_t|}{(A_t+F_t)/2}$
  - MAE en representación porcentual
  - Tiene límite superior (200%) inferior (0%)
- WMAPE (MAPE ponderado):
  - $WMAPE=\frac{\sum_{t=1}^{n}|A_t-F_t|}{\sum_{t-1}^n|A_t|}$
  - Evaluar los errores de diferentes órdenes de magnitud de manera equivalente
  - Resolver para MAPE Dividir por cero

2. Clasificación de modelos

2.1 Métodos tradicionales

MA (promedio móvil, que toma el promedio de las observaciones en los últimos n puntos de tiempo como el pronóstico para el siguiente punto):
- Ventajas: rápido, funciona bien como base.
- Desventajas: no se pueden realizar varios pasos y hay un problema de retraso.
ARIMA (Media Móvil Autorregresiva):
- Pros: más fuerte que el ajuste MA y AR
- Desventajas: búsqueda de parámetros, tiempo de ejecución prolongado, necesidad de predecir cada secuencia por separado.
Prophet (modelo aditivo de descomposición secuencial):
- Ventajas: las tendencias no lineales no tienen ninguna ventaja en las variables externas estacionales y pueden generar probabilidades.
- Desventajas: predicción de secuencia única, laboriosa a gran escala.
Otros: Orbit y NeuralProphet, no tan buenos.
defecto:
- Hay algunos requisitos de naturaleza para el tiempo en sí, no para la optimización de extremo a extremo;
- Solo se puede hacer una predicción de secuencia única y la sobrecarga de rendimiento es alta.
- Autorregresivo, no se pueden introducir covariables.
- La predicción de varios pasos no funciona.

2.2 Métodos de aprendizaje automático

Modelado
- Problemas de la tabla de conversión de series de tiempo

ingeniería de funciones
- Las nuevas funciones se construyen de acuerdo con diferentes tipos de funciones, y la parte de preprocesamiento no se trata aquí.
- Herramienta automática de ingeniería de funciones de series temporales: tsfresh (según otros documentos, la automatización completa no es lo suficientemente inteligente, generará muchas funciones y puede explotar la memoria)
  - documentación oficial de tsfresh
  - análisis chino tsfresh
- Introducción a otros métodos de funciones de series temporales: zhuanlan.zhihu.com/p/67832773
Modelo
- GBDT:
  - lightGBM, fastai (Optuna o FLAML se pueden usar para el ajuste automático de parámetros)
  - La expresión de las características comerciales es mejor que NN
- NN:
  - El aprendizaje de expresiones variables categóricas tendrá una mejor integración
  - diseño de pérdida flexible
  - El aprendizaje multiobjetivo es más conveniente que los modelos de árbol.

2.3 método DL

RNN (RNN, LSTM, GRU)
Seq2Seq (forma combinada RNN)

- 以RNN组件作为基本单元，encoder中做训练窗口的信息提取，decoder中做预测的多部输出。
- 评估：效果一般，计算开销大，稳定性不行，误差分析和模型解释难做。
复制代码

WaveNet (convolución causal atrosa)

-   比RNN好并行，使用一维CNN做序列预测，还加入residual connection和skip connection和一系列复杂的门机制。
-   评估：没RNN好用
复制代码

LSTNet

-   评估：不如特征工程+fastai
复制代码

DeepAR

-   Seq2Seq形式，但是能输出概率分布。
-   评估：难以稳定收敛，精度波动大，效果比不过GBDT。
复制代码

N-latidos

-   单变量预测，有一定的季节和趋势解释性。
-   评估：效果一般，不好加额外的特征变量。
复制代码

TFT

-   能和树模型叫板的DL模型，跟树模型有一定近似性，有特征变量选择网络。
-   评估：有点意思，由于其拟树形式的原理，效果稳定不少，但计算开销还是比较大。
复制代码

Resumen :
- En la actualidad, el efecto de GBDT es aún mejor que DL a gran escala.
- Los puntos fuertes de DL incluyen pre-entrenamiento, aprendizaje de transferencia y aprendizaje de representación, y los modelos generativos son difíciles de usar en el campo de series temporales.

2.4 Temporización AutoML

Bibliotecas:
- Auto_TS
Método convencional:
- Ingeniería de características + GBDT
- La interfaz de conjunto de datos de tiempo estructurado TFT es factible para la ingeniería automática de características.

Hablando de pronósticos de series de tiempo