El siguiente contenido es un resumen parcial de la lectura de los artículos técnicos de Yuanguan Data Boss. Consulte el texto original: Hablando de pronósticos de series temporales - Artículo de byte - Zhihu zhuanlan.zhihu.com/p/486343380
1. Prueba de efecto
-
Métrica insensible a la dimensión numérica:
-
SMPAE (MAPE simétrico):
-
-
MAE en representación porcentual
-
Tiene límite superior (200%) inferior (0%)
-
-
WMAPE (MAPE ponderado):
-
-
Evaluar los errores de diferentes órdenes de magnitud de manera equivalente
-
Resolver para MAPE Dividir por cero
-
-
2. Clasificación de modelos
2.1 Métodos tradicionales
-
MA (promedio móvil, que toma el promedio de las observaciones en los últimos n puntos de tiempo como el pronóstico para el siguiente punto):
- Ventajas: rápido, funciona bien como base.
- Desventajas: no se pueden realizar varios pasos y hay un problema de retraso.
-
ARIMA (Media Móvil Autorregresiva):
- Pros: más fuerte que el ajuste MA y AR
- Desventajas: búsqueda de parámetros, tiempo de ejecución prolongado, necesidad de predecir cada secuencia por separado.
-
Prophet (modelo aditivo de descomposición secuencial):
- Ventajas: las tendencias no lineales no tienen ninguna ventaja en las variables externas estacionales y pueden generar probabilidades.
- Desventajas: predicción de secuencia única, laboriosa a gran escala.
-
Otros: Orbit y NeuralProphet, no tan buenos.
-
defecto:
- Hay algunos requisitos de naturaleza para el tiempo en sí, no para la optimización de extremo a extremo;
- Solo se puede hacer una predicción de secuencia única y la sobrecarga de rendimiento es alta.
- Autorregresivo, no se pueden introducir covariables.
- La predicción de varios pasos no funciona.
2.2 Métodos de aprendizaje automático
-
Modelado
- Problemas de la tabla de conversión de series de tiempo
-
ingeniería de funciones
-
Las nuevas funciones se construyen de acuerdo con diferentes tipos de funciones, y la parte de preprocesamiento no se trata aquí.
-
Herramienta automática de ingeniería de funciones de series temporales: tsfresh (según otros documentos, la automatización completa no es lo suficientemente inteligente, generará muchas funciones y puede explotar la memoria)
-
Introducción a otros métodos de funciones de series temporales: zhuanlan.zhihu.com/p/67832773
-
-
Modelo
-
GBDT:
- lightGBM, fastai (Optuna o FLAML se pueden usar para el ajuste automático de parámetros)
- La expresión de las características comerciales es mejor que NN
-
NN:
- El aprendizaje de expresiones variables categóricas tendrá una mejor integración
- diseño de pérdida flexible
- El aprendizaje multiobjetivo es más conveniente que los modelos de árbol.
-
2.3 método DL
- RNN (RNN, LSTM, GRU)
- Seq2Seq (forma combinada RNN)
- 以RNN组件作为基本单元,encoder中做训练窗口的信息提取,decoder中做预测的多部输出。
- 评估:效果一般,计算开销大,稳定性不行,误差分析和模型解释难做。
复制代码
- WaveNet (convolución causal atrosa)
- 比RNN好并行,使用一维CNN做序列预测,还加入residual connection和skip connection和一系列复杂的门机制。
- 评估:没RNN好用
复制代码
- LSTNet
- 评估:不如特征工程+fastai
复制代码
- DeepAR
- Seq2Seq形式,但是能输出概率分布。
- 评估:难以稳定收敛,精度波动大,效果比不过GBDT。
复制代码
- N-latidos
- 单变量预测,有一定的季节和趋势解释性。
- 评估:效果一般,不好加额外的特征变量。
复制代码
- TFT
- 能和树模型叫板的DL模型,跟树模型有一定近似性,有特征变量选择网络。
- 评估:有点意思,由于其拟树形式的原理,效果稳定不少,但计算开销还是比较大。
复制代码
-
Resumen :
- En la actualidad, el efecto de GBDT es aún mejor que DL a gran escala.
- Los puntos fuertes de DL incluyen pre-entrenamiento, aprendizaje de transferencia y aprendizaje de representación, y los modelos generativos son difíciles de usar en el campo de series temporales.
2.4 Temporización AutoML
-
Bibliotecas:
- Auto_TS
-
Método convencional:
- Ingeniería de características + GBDT
- La interfaz de conjunto de datos de tiempo estructurado TFT es factible para la ingeniería automática de características.
\