der Reihe nach
(Langzeitreihenprognose)
Schiebefenster
Kurzfristige Vorhersage: Prophet (geeignet für Trendvorhersage), Arima (Kurzsequenzvorhersage ist genau, aber der Trend ist nicht genau)
Langfristige Vorhersage: Informant
Grundlegende Definition:
Regelmäßigkeit: langfristige Trends, saisonale Veränderungen, zyklische Veränderungen, unregelmäßige Veränderungen
Überlagerungsmodell: Die Volatilität des Zeitreihendiagramms bleibt konstant
Produktmodelle: Serien mit immer größeren saisonalen Schwankungen
Drei Grundmodelle: exponentielles Glättungsmodell, autoregressives Modell (AR), gleitendes Durchschnittsmodell (MA), autoregressives gleitendes Durchschnittsmodell (ARMA)
traditionelle Methode
Grundschritte des Modells
1. Klassisch
1> Zeitreihenzerlegung
Zerlegt in drei Teile: Trendposten, Saisonposten, Restposten, Addition und Multiplikation, zur Multiplikation kann der Logarithmus in einen Additionsposten umgewandelt werden
2> Gängige Zerlegungsmethoden
Methode des gleitenden Durchschnitts : Schätzen Sie die Zykluslänge, nehmen Sie einen Zyklus als Intervall, nehmen Sie den Durchschnittswert eines Datenelements, ermitteln Sie den Trend und verwenden Sie dann die Originaldaten, um den Trend zu subtrahieren und den Mittelwert verschiedener Datenblöcke zu ermitteln , ermitteln Sie den Zyklus und berechnen Sie das Residuum
X11 : Diese Methode ist robust und kann Ausreißer und Datenmutationen in Zeitreihen verarbeiten
2. ARIMA
Die Essenz ist AR+I+MA
Um die Größenordnung der Differenz zu bestimmen, stellen Sie sicher, dass die Daten stationär sind. Bei der Bestimmung von AR, MA oder ARMA
Die beste PiQ-Qualität kann durch Rastersuche ermittelt werden, wobei im Allgemeinen das AIC/BIC-Informationskriterium als Variable verwendet wird
3.Holt-Modell
Daten ohne offensichtliche Trends und saisonale Faktoren können eine einfache exponentielle Glättung (Holt erster Ordnung) verwenden.
Transformator
(Rekonstruktionseingabe der QKV-Berechnungsmethode)
(Aufmerksamkeitsmechanismus
Aufmerksamkeit sollte schnell sein, Decoder sollte einmal ausgeben, Stacking-Encoder sollte schnell sein)
RNN (Recurrent Neural Network)
Die Eingabedaten sind nicht mehr unabhängig voneinander und die letztgenannten Daten können Auswirkungen auf die ersteren haben
(Die Zeitreihe ist nicht begrenzt, es können auch Textdaten oder Videodaten sein.)
Immer noch ein Schiebefenster (Makarov-Annahme)
LTSM
Grundstruktur des Modells
class LSTM(nn.Module):
def __init__(self, input_size=1, hidden_layer_size=100, output_size=1):
super().__init__()
self.hidden_layer_size = hidden_layer_size
self.lstm = nn.LSTM(input_size, hidden_layer_size)
self.linear = nn.Linear(hidden_layer_size, output_size)
self.hidden_cell = (torch.zeros(1,1,self.hidden_layer_size),
torch.zeros(1,1,self.hidden_layer_size)) # (num_layers * num_directions, batch_size, hidden_size)
def forward(self, input_seq):
lstm_out, self.hidden_cell = self.lstm(input_seq.view(len(input_seq) ,1, -1), self.hidden_cell)
predictions = self.linear(lstm_out.view(len(input_seq), -1))
return predictions[-1]
- Für bessere Ergebnisse kann die Datenverarbeitung mit MinMaxScaler skaliert werden
- Im Allgemeinen gibt es zwei Formen der i-Eingabe: Eine besteht darin, zu denken, dass der Vektor die Eingabe jedes Zeitschritts ist, und die andere besteht darin, einen n-dimensionalen Vektor (Jahr, Monat, Tag, Stunde, Minute, Sekunde) einzugeben
- Die vollständig verbundene Schicht wird in der letzten Einheit von LSTM gespleißt
- Unterstützt im Allgemeinen nur Einzelschrittvorhersagen (Schiebefenster).
- Kombination von Lehrer-Truppe und Nicht-Lehrer-Truppe (es ist nicht klar, was)
Persönliche Projektzusammenfassung
Sequenzstationarisierungstest (Bestimmung des d-Werts)
Zeichnen Sie die Sequenz auf, führen Sie einen ADF-Test durch und führen Sie dann eine Stabilisierung erster und zweiter Ordnung durch
Wenn der Testwert t größer als die dreistufige Statistik ist, ist er instationär
Bestimmung von p-Werten und d-Werten
1. Der p-Wert wird anhand des maximalen Verzögerungspunkts des PACF-Diagramms des partiellen Autokorrelationskoeffizienten beurteilt, und der q-Wert wird anhand des maximalen Verzögerungspunkts des ACF-Diagramms des Autokorrelationskoeffizienten beurteilt
2. Traversensuche nach der Kombination der AIC- und BIC-Mindestparameter
3. ARIMA-Modell anpassen (p, d, q)
Maß zur Beurteilung
Resturteil
Bestimmen Sie die Linear- und Normalverteilung