【統計ノート】(12)時系列分析・予測

(12)時系列分析と予測

時系列データは、経時的な現象の特性を説明するために使用されます。

時系列(時系列)は、同じ現象の連続した観測を異なる時間に配置することによって形成されるシーケンスです。ほとんどの経済データは時系列の形式で提供されます。

時系列とその分解

時系列は、定常系列と非定常系列に分けることができます。

文房具シリーズは基本的にトレンドではありません。この種のシーケンスの観測値は基本的に一定のレベルで変動します。変動の程度は時間帯によって異なりますが、一定の規則はありません。図に示すように、変動はランダムであると見なすことができます。 :

非定常系列(非定常系列)は、季節的または定期的な傾向を含む系列であり、コンポーネントの1つだけを含む場合と、複数のコンポーネントを含む場合があります。したがって、非定常系列は、トレンド系列、トレンド系列と季節系列、およびいくつかのコンポーネントで構成される複合系列に分けることができます。

トレンド(Trend):長期的なトレンドとも呼ばれる、時系列における一種の継続的な上昇または継続的な下降です。時系列の傾向は線形または非線形です。

季節性(季節性)は季節変動(季節変動)とも呼ばれ、1年以内に繰り返される時系列の周期的な変動です。たとえば、ビジネスアクティビティでは、「ピークシーズン」または「オフシーズンの売上」という用語がよく聞かれます。それは本質的に定期的な変更を指します。

季節成分を含むシーケンスには、傾向が含まれる場合と含まれない場合があります。

周期性(周期的変動)は、周期的変動(周期的変動)とも呼ばれ、時系列に示される長期的なトレンドの周りの波状または振動の変化です。周期性は通常、ビジネスや経済活動によって引き起こされます。これは、傾向の変化とは異なり、単一方向の連続的な動きではなく、同じ変動で交互に変動します。また、比較的固定された法則を持つ季節変動とも異なります。また、変更サイクルは主に1年であり、周期的な変動には一定の法則がなく、変更サイクルは1年以上であり、サイクルの長さが異なります。周期性は通常、経済環境の変化によって引き起こされます。

さらに、時系列に影響を与える偶発的な要因がいくつかあり、時系列がランダムな変動を示します。時系列の傾向、周期性、季節性を削除した後の偶発的な変動は、不規則変動とも呼ばれるランダム性と呼ばれます。 

時系列のコンポーネントは、トレンド(T)、季節的または季節的変化(S)、周期的または周期的変動(C)、ランダム性または不規則変動(I)の4つのタイプに分類できます。

構成要素:長期トレンド、季節変化、周期的変化、不規則な変化。
1)長期トレンド(T)現象は、基本的な要因によって長期間にわたって形成される一般的な変化のトレンドです。
2)季節変動(S)現象は、1年以内に季節変動とともに発生する定期的な周期的変動です。
3)周期変動(C)現象として数年かかる周期的な波のうねりの周期的な変動。
4)不規則な変化(I)は、大きなランダムな変化や大きな影響を与える不規則な突然の変化を含む、不規則な変化です。


時系列タイプ

絶対時系列


期間シリーズ:合計期間インジケーターで整理された時系列。
期間シリーズの主な特徴は次のとおりです
。1)シリーズのインデックス値は加算的です。
2)シーケンス内の各インジケーターの値は、反映される期間の長さに直接関連しています。
3)シーケンスの各インジケーターの値は、通常、継続的な登録と集計を通じて取得されます。


時系列:合計タイム
ポイントで整理された時系列時系列の主な機能は次のとおりです
。1)系列のインデックス値は加算されません。
2)シーケンスの各インデックス値のサイズは、間隔の長さに直接関係しません。
3)シーケンスの各インジケーターの値は通常、定期的な登録を通じて取得されます。

相対時系列

時系列に配置された同じ種類の一連の相対指標によって形成される時系列は、相対番号時系列と呼ばれます。


平均時系列

平均時系列とは、一連の類似した平均指標によって時系列に並べられた時系列を指します。

時系列データをコンパイルするときに注意すべき問題

シーケンスの各期間のインデックス値の比較可能性を保証します

  • 期間は一貫している必要があります
  • 全体的な範囲は一貫している必要があります
  • 指標の経済的内容は統一されるべきです
  • 計算方法を統一する
  • 同等の計算価格と測定単位

 


成長率分析

これは、現象がさまざまな時間でどのように変化するかを説明しています。比較の基準期間が異なるため、成長率の計算方法は異なります。

(1)成長率(成長率):成長率は、レポート期間の観測値と基準期間の観測値の比率から時系列の1を引いた結果であり、%で表されます。比較の基準期間が異なるため、チェーン成長率と固定ベース成長率に分けることができます。

連鎖成長率:レポート期間の観測値の前の期間の観測値から1を引いた比率-1は、現象の期間ごとの成長変化の程度を示します。

固定ベースの成長率は、特定の固定期間の観測値に対するレポート期間の観測値のマイナス1であり、観測期間全体の現象の全体的な成長と変動を示します。

成長率をGとします:チェーンの成長率:

 

                                   固定基本成長率:

 

(2)平均成長率(平均増加率):平均成長率は、期間ごとのチェーンごとのチェーン値(チェーンごとの開発率)の幾何平均から時系列の1を引いた結果です。

   n:リング比の数

(3)成長率の分析で注意すべき問題

  • 時系列の観測値が0または負の数を示す場合、成長率を計算することは適切ではありません。この種のシーケンス計算の成長率は、数学の公理に適合していないか、その実際的な重要性を説明できません。絶対数は分析に使用できます。
  • 場合によっては、成長率について簡単に話すことができず、成長率と絶対レベルの組み合わせに注意を払うことができません。成長率は相対的な値であり、比較のベース値の大きさに関連しています。この場合、1%成長の絶対値を計算して、成長率分析の制限を克服します。1%成長の絶対値は、成長率の各パーセンテージポイント増加の絶対増加量を表します:1%成長の絶対値=以前のレベル/ 100

時系列予測手順

時系列分析の主な目的の1つは、既存の履歴データに基づいて未来を予測することです。時系列には、トレンド、季節性、周期性、ランダム性などのさまざまなコンポーネントが含まれます。特定の時系列では、1つのコンポーネントが含まれる場合と、複数のコンポーネントが同時に含まれる場合があります。異なるコンポーネントの時系列に使用される予測方法は異なります。

予測手順:

ステップ1:時系列に含まれるコンポーネントを決定し、時系列のタイプを決定する

ステップ2:このタイプの時系列に適した予測方法を見つける

ステップ3:可能な予測方法を評価して、最適な予測計画を決定する

ステップ4:最適な予測計画を使用して予測を行う

1.時系列コンポーネントを決定する

(1)トレンド要素を決定する

トレンドコンポーネントが存在するかどうかを判断するには、時系列の折れ線グラフを描画して、時系列にトレンドがあるかどうか、およびトレンドが線形か非線形かを確認します。

回帰分析を使用して傾向線を近似し、回帰係数の有意性をテストします。回帰係数は有意であり、線形傾向は有意であると結論付けることができます。

(2)季節構成を決定する

季節成分が存在するかどうかを判断するには、少なくとも2年分のデータが必要であり、データは四半期、月、週、または日ごとに記録する必要があります。プロット可能な折りたたまれた年次時系列プロット(年次折りたたみ時系列プロット)。年次データを個別にグラフに描画する必要があります。横軸は1年の長さで、年次データは縦軸に対応します。時系列に季節要素のみがある場合、年次折りたたみ時系列のポリラインにはクロスがあります。時系列に季節要素と傾向の両方が含まれる場合、年次折りたたみ時系列のポリラインにはクロスがありません。 、次の年のポリラインは前の年のポリラインよりも高くなり、下がると次の年のポリラインは前の年のポリラインより低くなります。

2.予測方法の選択
時系列タイプを決定したら、適切な予測方法を選択します。時間データを使用して予測を行う場合、通常、過去の傾向が将来にわたって続くと想定されているため、既存のパターンまたは過去のパターンに基づいて予測を行うことができます。時系列の予測方法:従来の方法:単純平均法、移動平均法、指数平滑法など、および最新の方法:Box-Jenkinsの自己回帰モデル(ARMA)。

一般に、時系列には不規則な要素が含まれますが、ビジネスデータや管理データでは、周期性は通常考慮されず、傾向要素と季節要素のみが考慮されます。

平滑化がランダムな変動を排除できる限り、トレンドと季節のコンポーネントのない時系列、つまり定常時系列はランダムなコンポーネントのみを含みます。したがって、このタイプの予測方法は、平滑予測方法とも呼ばれます。

3.予測手法の評価
特定の予測手法を選択する場合、予測効果や手法の精度を評価する必要がある。評価方法は、予測値と実際の値の間のギャップ、つまり予測誤差を見つけることです。最適な予測方法は、予測誤差を最小限に抑える方法です。

予測誤差の計算方法:平均誤差、平均絶対誤差、平均二乗誤差、平均パーセント誤差、平均絶対パーセント誤差。方法の選択は、予測者の目標と方法への精通度によって異なります。

(1)平均誤差:Y:観測値、F:予測値、n個の予測値

              

予測誤差の値は正または負になる可能性があるため、合計の結果は互いに相殺され、この場合、平均誤差は誤差を過小評価する可能性があります。

(2)平均絶対偏差(平均絶対偏差)は、予測誤差MADの絶対値を取った後の平均摩擦なし計算です。

        

平均絶対誤差は、誤差が互いに打ち消し合う問題を回避できるため、実際の予測誤差を正確に反映できます。

(3)平均二乗誤差(平均二乗誤差):二乗による誤差の符号を除去した後に計算された平均誤差、MSE:

     

(4)平均パーセント誤差と平均絶対パーセント誤差

ME、MAD、およびMSEのサイズは、時系列データのレベルと測定単位の影響を受けます。これは、予測モデルの品質を実際には反映していない場合があります。異なるモデルによる同じデータの予測を比較する場合にのみ意味があります。平均パーセンテージエラー(MPE)と平均絶対パーセンテージエラー(MAPE)は異なり、時系列データレベルと測定単位の影響を排除し、エラーのサイズを反映する相対値です。

 

 

定常シリーズの予測

定常時系列にはランダム成分のみが含まれ、予測方法は、単純平均法、移動平均法、指数平滑法です。

主に時系列を平滑化してランダムな変動を排除することにより、平滑化法とも呼ばれます。平滑化方法は、時系列の短期予測に使用でき、時系列を平滑化して系列のトレンド(線形トレンドと非線形トレンド)を記述するためにも使用できます。

(1)単純平均法:期間tの既存の観測に基づいて単純平均法によって次の期間の値を予測します。時系列の既存のt相観測値を設定する

、その後、期間t + 1の予測値は次のとおりです。

t + 1期間の後、t + 1期間の実際の値を使用すると、t + 1期間の予測誤差は次のようになります。e_ {t + 1}=Y_ {t + 1}-F_ {t + 1}

 

期間t + 2の予測値:

単純平均法は、比較的安定した時系列を予測するのに適しています。つまり、時系列に傾向がない場合は、この方法を使用することをお勧めします。ただし、時系列に傾向または季節的要素がある場合、この方法の予測は十分に正確ではありません。単純な平均化方法では、将来の値と同様に将来の値を扱います。予測の観点から見ると、最近の値は長期的な値よりも将来に大きな影響を与えるため、単純平均法の結果は十分に正確ではありません。

(2)移動平均法(移動平均):平均値を時系列で時系列に予測値として求める予測法単純移動平均法と加重移動平均法(加重移動平均法)がある。平均)。

単純移動平均は、最新のk期間データを次の期間の予測値として平均化します。移動平均間隔がk(1 <k <t)の場合、期間tの移動平均は次のようになります。

これは、時系列を平滑化した結果です。これらの平滑化された値は、時系列の変化するパターンまたは傾向を表すことができます。予測にも使用できます。

期間t + 1の単純な移動平均予測は次のとおりです。

期間t + 2の単純な移動平均予測は次のとおりです。

移動平均法は最新のk周期のデータのみを使用するため、移動平均を計算する場合、移動間隔はkであり、比較的安定した時系列の予測にも適しています。アプリケーションの鍵は、合理的な移動平均間隔kを決定することです。同じ時系列に対して、異なる移動間隔を使用すると、予測の精度が異なります。実験により、平均二乗誤差を最小にする移動間隔を選択できます。移動間隔は小さいため、変更をすばやく反映できますが、変更傾向を反映できません。移動間隔は大きいため、変更傾向を反映できますが、予測値には大きな遅れ偏差があります。

移動平均法の基本的な考え方:移動平均は、偶発的な要因によって引き起こされるランダムな変化によって引き起こされる時系列データを排除または削減でき、短期的な予測に適しています。

(3)指数平滑法(指数平滑法)は、過去の観測値の加重平均を予測して、期間tの実際の観測値と期間t + 1の予測値などの期間tの予測値の加重平均を作成することです。指数平滑法は、移動平均法から発展した、改良された加重平均法です。履歴データを放棄しないことを前提に、予測期間に近い履歴データには大きな重みが与えられ、重みは近くから遠くにかけられます。指数法則に従って減少するため、指数平滑法と呼ばれます。1回の指数平滑法、2回の指数平滑法、3回の指数平滑法があります。

1回限りの指数平滑法は、単一指数平滑法(単一指数平滑法)とも呼ばれ、平滑化係数は1つしかなく、観測値が予測期間から長くなるほど、重みは小さくなります。指数平滑法は、ある期間の予測値と観測値の線形結合をt + 1期間の予測値として使用することです。予測モデルは、F_ {t + 1} = \ alpha Y_t +(1- \ alpha)F_t      \アルファ平滑化係数(0 \ leq \ alpha \ leq 1)です。

期間t + 1のデータは、期間tの実際の観測値と期間tの予測値の加重平均です。フェーズ1の予測値=フェーズ1の観測値

フェーズ2の予測:F_ {2} = \ alpha Y_1 +(1- \ alpha)F_1 = \ alpha Y_1 +(1- \ alpha)Y_1 = Y_1

フェーズ3の予測:F_ {3} = \ alpha Y_2 +(1- \ alpha)F_2 = \ alpha Y_2 +(1- \ alpha)Y_1

第4予測:F_ {4} = \ alpha Y_3 +(1- \ alpha)F_3 = \ alpha Y_3 + \ alpha(1- \ alpha)Y_2 +(1- \ alpha)^ 2Y_1

指数平滑法の予測精度では、平均二乗誤差を使用して測定します。

F_ {t + 1} = \ alpha Y_t +(1- \ alpha)F_t

          = F_t + \ alpha(Y_t-F_t)

期間tの予測値に期間tの調整済み予測誤差を加えたものY_t-F_tです)。

指数平滑を使用する場合は、重要な問題は、適切な平滑化係数を決定することで\アルファ、異なる\アルファ予測結果に異なる効果を持っています。

\アルファ= 0、予測値は前の期間を繰り返す予測結果である; \アルファ= 1、予測値は前の期間の実際の値。

\アルファ1に近いほど、時系列の変化に対するモデルの応答がタイムリーになります。これは、現在の実際の値に予測値よりも大きな重みを与えるためです。

\アルファ0に近づくほど、現在の予測値に与えられる重みが大きくなり、時系列の変化に対するモデルの応答が遅くなります。

時系列に大きなランダムな変動がある場合は、大きな変動を選択\アルファして最新の変更にすばやく対応し、時系列が比較的安定している場合は小さな変動を選択します\アルファ

実際のアプリケーションでは、予測誤差を考慮する必要があり、平均二乗誤差を使用して予測誤差のサイズを測定します。決定されたら、いくつかを選択し\アルファて予測行い、最終的な\アルファとして最小の予測誤差を見つけることができます

移動平均法と同様に、指数平滑法を使用して時系列を平滑化し、ランダムな変動を排除して、系列の傾向を見つけることができます。

指数平滑法で予測する場合、値は通常0.5以下です。0.5より大きい場合、実際の値に近い可能性があり、シーケンスに特定の傾向または過度の変動があることを示します。

ダンピング係数\ベータ= 1- \アルファ  、ダンピング係数  が小さいほど、予測結果に対する最近の実際の値の影響が大きくなり、逆の場合も小さくなります。減衰係数は、時系列の変化する特性に従って選択されます。

指数平滑法

指数平滑法は、実際には特別な加重移動平均法です。

その特徴は次のとおりです。

まず、指数平滑法は、観測期間中の予測に対する最近の観測の影響をさらに強化します。異なる時間に観測に与えられる重みが変化するため、最近の観測の重みが増加するため、予測値を迅速に市場の実際の変化を反映します。重みは等しい系列によって削減されます。この系列の最初の項は平滑化定数aであり、共通の比率は(1- a)です。

第2に、指数平滑法は、観測によって与えられた重みに対して柔軟であり、重みの変化率を変更するために異なるa値をとることができます。aの値が小さい場合、重みの変化はより速くなり、観測値の最近の傾向を指数移動平均にすばやく反映できます。したがって、指数平滑法を使用して、aの異なる値を選択し、時系列観測の均一性(つまり、傾向変化の安定度)を調整できます。

異なる平滑化時間に応じて、指数平滑法は、一次指数平滑法、二次指数平滑法、および三次指数平滑法に分けられます。


トレンドシリーズの予測

時系列予測分析方法とも呼ばれる傾向予測分析方法は、ビジネス開発の継続性の原則に基づいており、数学的統計的方法を適用して過去の履歴データを時系列に配置し、特定の数値モデルを使用して計画期間の出力を予測および予測します予測方法の販売)数量または生産(販売)量。
トレンド測定計画中の販売数量または販売金額の予測分析方法で採用されているさまざまな数学的方法により、次のように分類できます。

  • 算術平均法。過去数期間の販売量(または販売額)の算術平均を計画期間の販売予測数とする。この方法の利点は、計算が簡単なことですが、平均値をとっているため比較的粗く、測定量と実量の誤差​​が大きいため、比較的安定した販売のみに適しています季節の食材がない、日用品などの商品
  • 移動加重平均法。計画期間からの距離に応じて、過去数回の販売量(または販売額)に応じて重み付けを行います(近い将来の加重数は大きく、未来の加重数は小さいです)。売上予測数いわゆる「モバイル」とは、平均の計算が徐々に進むことを指します。
  • 指数平滑法。計画期間の販売量(または販売量)を予測する場合、平滑化係数(または重み係数)が導入されて計算されます。指数平滑法と移動加重平均法はほぼ同様であり、実際の売上に含まれる偶発的な要因の影響を排除できるという利点があります。しかし、平滑化指数の値の決定には、特定の主観的な要素もあります。平滑化係数が大きいほど、最近の実際の数値が予測結果に与える影響が大きくなり、逆に小さくなります。したがって、このメソッドの平均が観測の変化の長期的な傾向を反映できるように、より小さな平滑化係数が使用されます;このメソッドの平均が短期の変化のマウンド期間中の観測の変化傾向を反映できるように、より小さな平滑化係数も使用できます売上予測、

 


複合シーケンスの分解予測

複合シーケンスは、傾向、季節、サイクル、およびランダムなコンポーネントを含むシーケンスを指します。

このタイプのシーケンスの予測方法は、通常、時系列のさまざまな要素を順番に分解してから予測を行うことです。

周期的成分の分析には長年のデータが必要であるため、実際には長年のデータを取得することは難しいため、使用する分解モデルは次のとおりです。

\ large Y_ {t} = T_ {t} \ times S_ {t} \ times I_ {t}

このモデルは、時系列にトレンド要素、季節要素、およびランダム要素が含まれていることを示しています。

この種のシーケンスの予測方法には、主に季節的重回帰モデル、季節的自己回帰モデル、時系列分解法予測が含まれます。

分解予測は通常、次の手順で実行されます。

ステップ1:季節的な要素を特定して分離します。

ステップ2:予測モデルを確立して予測を行う。

ステップ3:最終的な予測値を計算します。

             予測値に対応する季節指数を乗算して、最終的な予測値を取得します。

季節指数(季節指数)は、各月または1年の季節におけるシーケンスの典型的な季節特性を特徴付けます。

平均トレンド消去法など、季節指数を計算する方法はたくさんあります。

季節変動トレンドを判別する「移動平均トレンド解消法」。基本的な手順は次のとおりです。

まず、各年の四半期(または月)データ(Y)に基づいて4シーズン(または12か月)の移動平均を計算し、次に「正」になるように各期間の第2四半期(月)の移動平均を計算します。長期トレンド値(T)。

次に、実際の値(Y)を対応する移動平均(T)で割り、各期間のY / Tを求めます。長期的なトレンドの影響を排除した時系列であり、季節指数と呼ばれる相対的な数値です。結果は、テーブルの4番目の列の値です。

第三に、季節比を計算するために「同時平均法」に従ってY / Tを再配置します。次に、この方法の要件に従って、最初に「異なる年の同じ季節の平均」を計算し、次に「同じ季節の異なる季節の平均の平均」、つまり長期的な傾向の変化を排除した後の新しい系列の時系列平均を計算します。季節比率を計算し、グラフを描きます。


季節変動

季節変動とは、季節の変化に伴う1年以内の社会的および自然的要因の影響による特定の社会現象の定期的な周期的変動を指します。1年以内に、季節変動により、特定の社会的および経済的現象(特定の時系列)が定期的に変更されます。このような定期的な変更は通常、季節変動と呼ばれます。食品、衣料品、季節性の強い商品・商品など、生産・消費量は季節の変化により周期的に変動し、「ピークシーズン」と「オフシーズン」があります。

季節変動には3つの明白な特徴があります:
(1)季節変動には一定の規則性と周期性があります;
(2)季節変動は毎年繰り返されて繰り返されます;
(3)季節変動は同様の軌跡を持っています 

季節変動の測定には多くの方法があり、一般的に使用される2つの方法は、同じ期間の平均法と傾向消去法です。 
同期平均法
この方法は、季節変動を決定する最も簡単な方法です。数年分のデータを使用して、同じ月(季節)の平均レベルと通年の合計月(季節)を見つけ、2つの結果を比較して各月(季節)の季節指数を調べ、季節変動の程度を示します。月平均法は、直接(四半期)月平均法と比率月平均法の2種類に分けられます。  


1.直接月間平均法
直接月間(四半期)平均法は、時系列全体のトレンド値を一定とみなします。計算手順は次のとおりです。
(1)
毎年の同じ月(四半期)の平均を計算します; (2)毎年のすべての月(または四半期)の合計平均を計算します;
(3)季節指数を計算します。[4] 
2.比例月間(季節)平均法
この方法では、各暦年の月間(四半期)データを、月間(四半期)平均前の今年の月間(四半期)平均と比較します。その年の季節比率を取得し、次に各年の同じ期間(月または季節)の比率を平均して季節指数を見つけます。 


移動平均トレンド除去法
明らかな長期トレンド変化を伴うシリーズでは、季節変動を測定するために、トレンド変化要因を最初に削除する必要があります。時系列に対するトレンド変化、季節変動、周期変動、および不規則な変化の影響が乗法モデルによって反映されると仮定すると、移動平均トレンド除去法を使用して季節変動を測定する手順は次のとおりです。
(1)元の時系列の移動平均を対応するものとして見つける期間のトレンド値。
(2)元のシーケンスのトレンド変化、つまり元のシーケンスの対​​応する時間データを移動平均で除算したものを除外します。
(3)トレンドの変化を取り除いた後、系列に基づいて季節指数を計算し、季節変動を測定します。 

 

元の記事646件を公開 賞賛された198件 690,000回

おすすめ

転載: blog.csdn.net/seagal890/article/details/105588571