Data-Mining-Zeitreihenanalyse

1. Konzept

Zeitfolgen

Unter Zeitreihen versteht man eine Abfolge, in der die Werte desselben statistischen Indikators in der Reihenfolge ihres Auftretenszeitpunkts angeordnet sind (eine Abfolge von Beobachtungswerten in gleichmäßigen Zeitintervallen).

Der Hauptzweck der Zeitreihenanalyse besteht darin, die Zukunft auf der Grundlage vorhandener historischer Daten vorherzusagen.

Die Zeitreihenanalyse umfasst hauptsächlich: Trendanalyse, Sequenzzerlegung und Sequenzvorhersage.

Zeitreihenzerlegung

Zeitreihen werden nach Saisonalität klassifiziert und in saisonale Zeitreihen und nicht-saisonale Zeitreihen unterteilt.

Komponenten von Zeitreihen:

  • Langfristiger Trend T: Der allgemeine Trend von Veränderungen, die durch ein Phänomen entstehen, das über einen langen Zeitraum von einigen fundamentalen Faktoren beeinflusst wird

  • Saisonale Veränderungen S: regelmäßige zyklische Veränderungen von Phänomenen, die mit saisonalen Veränderungen innerhalb eines Jahres auftreten

  • Zyklischer Trend C: Das Phänomen weist über einen Zeitraum von mehreren Jahren regelmäßige Veränderungen in Form von Wellen auf.

  • Unregelmäßige Veränderungen I: Es handelt sich um eine unregelmäßige Veränderung, die streng zufällige Veränderungen und unregelmäßige plötzliche Veränderungen mit großer Auswirkung umfasst.

2. Nicht-saisonale Zeitreihen

Gleitender Durchschnitt (MA, Moving Average)

Der gleitende Durchschnitt ist eine einfache Glättungstechnik, die die langfristigen Änderungen und Entwicklungstrends von Indikatoren ausdrückt, indem nacheinander der Mittelwert einer bestimmten Anzahl von Elementen einer Zeitreihe ermittelt wird.

1. Einfacher gleitender Durchschnitt (SMA) 

Der einfache gleitende Durchschnitt ist ein einfacher arithmetischer Durchschnitt der ersten n Werte in der Zeitreihe.

SMAn = ( x1 + x2 + …… + xn)/ n

2. Gewichteter gleitender Durchschnitt (WMA)

Der gewichtete gleitende Durchschnitt basiert auf dem einfachen gleitenden Durchschnitt und weist jedem Wert der vorherigen n Perioden in der Zeitreihe, also dem Ergebnis des gewichteten Durchschnitts, entsprechende Gewichtungen zu

Die Grundidee: Aktuelle Daten verbessern und den Einfluss langfristiger Daten auf den aktuellen Prognosewert abschwächen, sodass der Prognosewert näher am aktuellen Trend liegt.

WMAn = w1x1 + w2x2 + …… + wnxn

3. Zerlegung nichtsaisonaler Zeitreihen

Zerlegen Sie die nichtsaisonale Zeitreihe in zwei Teile: Trend und unregelmäßige Fluktuation.

#Importieren Sie Daten und zeichnen Sie Grafiken, um die folgenden Grafiken zu erhalten

Bild

Bild

Bild

3. Saisonale Zeitreihen

Wenn in einer Zeitreihe Ähnlichkeiten nach n Zeitintervallen auftreten, weist die Reihe saisonale Merkmale mit einer Periode von n auf.

Zerlegung saisonaler Zeitreihen

Zerlegen Sie die saisonale Zeitreihe in drei Teile: Trend, Periodizität und unregelmäßige Fluktuation.

Tipps: Die Zeitspalte muss in eine Indexspalte umgewandelt werden, um Berechnungen zu erleichtern

Bild

Bild

4. Sequenzvorhersage

1. Konzept

 Vorhersage

Bei der vorläufigen Schätzung und Spekulation von Dingen, die noch nicht geschehen sind oder derzeit unklar sind, geht es um die Diskussion und Untersuchung der Ergebnisse von Dingen, die zum jetzigen Zeitpunkt geschehen werden. Einfach ausgedrückt bezieht es sich auf die Vorhersage unbekannter Ereignisse aus bekannten Ereignissen.

 Zeitreihenprognose

Durch die Analyse der Zeitreihen können wir auf der Grundlage des Entwicklungsprozesses, der Richtung und des Trends, die sich in der Zeitreihe widerspiegeln, Analogien oder Erweiterungen vornehmen, um das Niveau vorherzusagen, das in der nächsten Zeitspanne oder in mehreren darauffolgenden Zeitspannen erreicht werden kann .

Stationäre Zeitreihen

Stationäre Zeitreihen, deren statistische Merkmale sich mit der Zeit nicht ändern, verwenden im Allgemeinen Mittelwert, Varianz oder Kovarianz als statistische Merkmale.

Differenz (integriert)

Bild

Häufig verwendete Zeitreihen-Prognosemodelle:

AR(p)-Modell (Autoregressives Modell): Das autoregressive Modell beschreibt die Beziehung zwischen aktuellen Werten und historischen Werten

MA(q)-Modell (Modell des gleitenden Durchschnitts): Das Modell des gleitenden Durchschnitts beschreibt die Anhäufung von Fehlern im autoregressiven Teil

ARMA-Modell:Das sogenannte ARMA-Modell bezieht sich aufdie Umwandlung instationärer Zeitreihen in stationäre Zeitreihen, und erstellen Sie dann ein Modell, indem Sie die abhängige Variable nur auf ihren verzögerten Wert und den aktuellen Wert und den verzögerten Wert des Zufallsfehlerterms zurückführen.

Bild

Bild

Bild

Bild

Bild

Bild

Bild

Bild

Bild

Supongo que te gusta

Origin blog.csdn.net/qq_39312146/article/details/134699381
Recomendado
Clasificación