Notizbuch - Zeitreihen

der Reihe nach

(Langzeitreihenprognose)

Schiebefenster

Kurzfristige Vorhersage: Prophet (geeignet für Trendvorhersage), Arima (Kurzsequenzvorhersage ist genau, aber der Trend ist nicht genau)

Langfristige Vorhersage: Informant

Grundlegende Definition:

Regelmäßigkeit: langfristige Trends, saisonale Veränderungen, zyklische Veränderungen, unregelmäßige Veränderungen

Überlagerungsmodell: Die Volatilität des Zeitreihendiagramms bleibt konstant

Produktmodelle: Serien mit immer größeren saisonalen Schwankungen

Drei Grundmodelle: exponentielles Glättungsmodell, autoregressives Modell (AR), gleitendes Durchschnittsmodell (MA), autoregressives gleitendes Durchschnittsmodell (ARMA)

traditionelle Methode

Grundschritte des Modells

1. Klassisch

1> Zeitreihenzerlegung

Zerlegt in drei Teile: Trendposten, Saisonposten, Restposten, Addition und Multiplikation, zur Multiplikation kann der Logarithmus in einen Additionsposten umgewandelt werden

2> Gängige Zerlegungsmethoden

Methode des gleitenden Durchschnitts : Schätzen Sie die Zykluslänge, nehmen Sie einen Zyklus als Intervall, nehmen Sie den Durchschnittswert eines Datenelements, ermitteln Sie den Trend und verwenden Sie dann die Originaldaten, um den Trend zu subtrahieren und den Mittelwert verschiedener Datenblöcke zu ermitteln , ermitteln Sie den Zyklus und berechnen Sie das Residuum

X11 : Diese Methode ist robust und kann Ausreißer und Datenmutationen in Zeitreihen verarbeiten

2. ARIMA

Die Essenz ist AR+I+MA

Um die Größenordnung der Differenz zu bestimmen, stellen Sie sicher, dass die Daten stationär sind. Bei der Bestimmung von AR, MA oder ARMA

Die beste PiQ-Qualität kann durch Rastersuche ermittelt werden, wobei im Allgemeinen das AIC/BIC-Informationskriterium als Variable verwendet wird

3.Holt-Modell

Daten ohne offensichtliche Trends und saisonale Faktoren können eine einfache exponentielle Glättung (Holt erster Ordnung) verwenden.

Transformator

(Rekonstruktionseingabe der QKV-Berechnungsmethode)

(Aufmerksamkeitsmechanismus

Aufmerksamkeit sollte schnell sein, Decoder sollte einmal ausgeben, Stacking-Encoder sollte schnell sein)

RNN (Recurrent Neural Network)

Die Eingabedaten sind nicht mehr unabhängig voneinander und die letztgenannten Daten können Auswirkungen auf die ersteren haben

(Die Zeitreihe ist nicht begrenzt, es können auch Textdaten oder Videodaten sein.)

Immer noch ein Schiebefenster (Makarov-Annahme)

LTSM

Grundstruktur des Modells

class LSTM(nn.Module):
    def __init__(self, input_size=1, hidden_layer_size=100, output_size=1):
        super().__init__()
        self.hidden_layer_size = hidden_layer_size

        self.lstm = nn.LSTM(input_size, hidden_layer_size)

        self.linear = nn.Linear(hidden_layer_size, output_size)

        self.hidden_cell = (torch.zeros(1,1,self.hidden_layer_size),
                            torch.zeros(1,1,self.hidden_layer_size)) # (num_layers * num_directions, batch_size, hidden_size)

    def forward(self, input_seq):
        lstm_out, self.hidden_cell = self.lstm(input_seq.view(len(input_seq) ,1, -1), self.hidden_cell)
        predictions = self.linear(lstm_out.view(len(input_seq), -1))
        return predictions[-1]
  • Für bessere Ergebnisse kann die Datenverarbeitung mit MinMaxScaler skaliert werden
  • Im Allgemeinen gibt es zwei Formen der i-Eingabe: Eine besteht darin, zu denken, dass der Vektor die Eingabe jedes Zeitschritts ist, und die andere besteht darin, einen n-dimensionalen Vektor (Jahr, Monat, Tag, Stunde, Minute, Sekunde) einzugeben
  • Die vollständig verbundene Schicht wird in der letzten Einheit von LSTM gespleißt
  • Unterstützt im Allgemeinen nur Einzelschrittvorhersagen (Schiebefenster).
  • Kombination von Lehrer-Truppe und Nicht-Lehrer-Truppe (es ist nicht klar, was)

Persönliche Projektzusammenfassung

Sequenzstationarisierungstest (Bestimmung des d-Werts)

Zeichnen Sie die Sequenz auf, führen Sie einen ADF-Test durch und führen Sie dann eine Stabilisierung erster und zweiter Ordnung durch

Wenn der Testwert t größer als die dreistufige Statistik ist, ist er instationär

Bestimmung von p-Werten und d-Werten

1. Der p-Wert wird anhand des maximalen Verzögerungspunkts des PACF-Diagramms des partiellen Autokorrelationskoeffizienten beurteilt, und der q-Wert wird anhand des maximalen Verzögerungspunkts des ACF-Diagramms des Autokorrelationskoeffizienten beurteilt

2. Traversensuche nach der Kombination der AIC- und BIC-Mindestparameter

3. ARIMA-Modell anpassen (p, d, q)

Maß zur Beurteilung

Resturteil

Bestimmen Sie die Linear- und Normalverteilung

Acho que você gosta

Origin blog.csdn.net/RandyHan/article/details/130212908
Recomendado
Clasificación