時系列予測のための機能エンジニアリング

時系列予測のための機能エンジニアリング

ラグ、ウィンドウ、および季節の特徴を作成し、代入とコーディングを実行し、datetime 変数を抽出し、外れ値を削除します。

コースの英語名: Feature Engineering for Time Series Forecasting

このビデオ チュートリアルは合計 5.83 GB で、中国語と英語の字幕、鮮明な画質、透かしなし、完全なソース コードが添付されています。

コース アドレス: https://xueshu.fun/1456デモ アドレス: https://www.udemy.com/course/feature-engineering-for-time-series-forecasting/

授業内容

あなたは何を学びますか

  • 従来の機械学習モデルを使用して予測を行う方法
  • 時系列を予測機能テーブルに変換する方法
  • 時系列予測の欠損データを補完する方法
  • 時系列予測で外れ値を検出して削除する方法
  • ラグとウィンドウを使用して過去のデータからフィーチャを作成する方法
  • 季節性と傾向を捉える機能を構築する方法
  • 時系列予測のカテゴリ変数をエンコードする方法
  • 祝日や広告キャンペーンなどの特別なイベントを強調する方法
  • 未来への複数のステップを予測する方法

必須

  • Python のインストール
  • Jupyter ノートブックのインストール
  • Python コーディングのヒント
  • Numpy、Pandas、Matplotlib の経験
  • Scikit-Learn に精通している
  • 機械学習アルゴリズムに精通している

説明

Feature Engineering for Time Series Forecastingへようこそ。これは、予測機能エンジニアリングに関する最も包括的なオンライン コースですこのコースでは、予測のために時系列データから特徴を作成および抽出する方法を学習します。

時系列予測のための機能エンジニアリングの技術をマスターする

このコースでは、線形回帰、ランダム フォレスト、勾配ブースティング マシンなどの市販の回帰モデルを使用した予測に適した、時系列データから特徴を抽出して作成するためのいくつかの特徴エンジニアリング手法を学習します。

具体的には、次のことを学びます。

  • ヒステリシス機能の作成方法;
  • ウィンドウ関数の作成方法;
  • 季節性と傾向を捉える機能を作成する方法。
  • 複数の季節性を持つ時系列を分解する方法;
  • 日付と時刻から特徴を抽出する方法;
  • 時系列で欠損データを補完する方法;
  • 時系列でカテゴリ変数をエンコードする方法;
  • 時系列の外れ値を特定して削除する方法;
  • 予測機能を作成する際にデータ漏洩と先読みバイアスを回避する方法;
  • 機能などを変換する方法。

予測における特徴量エンジニアリングの課題

予測とは、過去のデータに基づいて将来について予測するプロセスです。最も伝統的なシナリオでは、時系列があり、その将来の値を予測したいと考えています。予測関数の作成にはいくつかの課題があります。

  • 慎重に設計された一連の機能とターゲット変数を使用して、時系列データを表形式のデータに変換する必要があります。
  • 予測機能を作成するときは、先読みバイアスによってデータが漏洩しないように特に注意する必要があります。
  • 予想どおり、時系列データは時間の経過とともに変化します。予測関数を構築する際には、これを考慮する必要があります。
  • 未来への複数の時間ステップの目標値を予測するには、過去から未来への特徴を推定する方法を慎重に検討する必要があります。

線形回帰、ツリーベースのモデル、サポート ベクター マシンなどの市販の回帰モデルを使用して、時系列の将来の値を予測できます。ただし、これらのモデルには入力として表形式のデータが必要です。予測の場合、特徴テーブルとターゲット変数ではなく、一連の時系列 (場合によっては 1 つの時系列) から開始します。時系列を、教師あり学習モデルで使用できるターゲット変数と一連の機能を使用して表形式のデータに変換する必要があります。したがって、主な課題は、適切に設計されたターゲット変数と、時系列の将来の価値を予測できる特別に設計された機能を作成することです。

時系列予測のターゲット変数と機能の作成には、独自の落とし穴があります。主な問題は、先読みバイアスと呼ばれるデータ漏洩の形態です。これは、予測の時点ではなく、将来のみわかる情報を使用して誤って予測を行う場合です。これにより、実際には機能しない場合でも、優れた予測モデルがあるように錯覚することができます。特徴エンジニアリング中に先読みバイアスを導入するのは簡単であり、それを回避する方法を示します。

時系列データは時間の経過とともに変化します。つまり、従来の表形式のデータに対して行われた仮定とは異なり、将来のデータは過去のデータと同じ分布とパターンを持つ場合と異なる場合があります。この時間の経過に伴う分布とパターンの変化は、非定常性と呼ばれます。時系列データでは、傾向と季節性の単純な存在が非定常性につながる可能性があります。したがって、このダイナミクスを捉える機能を作成することは、時系列予測の課題です。

多くの場合、将来の複数の時間ステップを予測したいと考えています。これには、1) 構築されたモデルを再帰的に適用して将来の 1 ステップを予測する、2) 将来の後の期間のターゲットを直接予測するモデルを構築する、などのさまざまな方法があります。1 つの課題は、2 つのアプローチに必要な機能エンジニアリングが異なることです。これらの違いについては、コースで説明します。

過去の値に基づいて時系列の将来の値を予測できる一連の機能を作成するにはどうすればよいでしょうか? 追加情報を追加して、予測のためのより豊富なデータセットを作成するにはどうすればよいでしょうか? このコースでは、そのすべてを学びます。

予測合成機能工学コース

予測に役立つ機能を作成するには、多くの場合、時系列を注意深く調査して傾向や季節性などの予測パターンを見つけ、それらをドメイン知識と組み合わせる必要があります。最近、時系列機能を自動的に作成しようとする傾向が高まっています。

このコースでは、時系列の将来の値を予測するために、すぐに使用できる機械学習モデルをトレーニングできるように、時系列から特徴を作成する方法を学習します。まず、時系列を分析し、予測機能の作成に使用できる属性を特定する方法を学習します。たとえば、さまざまなアルゴリズムを使用して傾向と季節性を自動的に特定して抽出する方法や、時系列を変換して分解と予測を容易にする方法を学びます。相互相関、自己相関、偏自己相関プロットなどのツールを使用して、適切なラグ機能を作成する方法を示します。トレンド、変化点、季節性、カレンダー効果、外れ値などをシミュレートする機能を作成するためのヒント、コツ、コツを見つけることができます。データ分析とドメイン知識に基づいて、機能を作成できます。

その後、 **特徴量エンジニアリング** プロセスを自動化して、時系列予測用の多数の特徴量を作成し、その後、より多くの予測特徴量を選択する方法を学習します。ここでは、複数の関数を自動または半自動で作成できるオープン ソース ライブラリを使用し、最も価値のある関数を選択します。Python ライブラリの Feature-engine、および tsfresh と featuretools については後で紹介します。

魅力的なビデオ チュートリアルを順を追って説明し、時系列予測のための有意義な機能を作成するために知っておくべきことをすべて教えます。この包括的なコースでは、時系列予測のためのエンジニアリング機能へのほぼすべての可能なアプローチをカバーします。それらのロジック、Python の実装、長所と短所、およびこれらの方法を使用する際の留意点について説明します。

具体的には、次のことを学びます。

  • マルチシーズンの時系列を含む、時系列のコンポーネントを特定して分離します。
  • 傾向、変化点、および季節性を捉える特徴を作成します。
  • ターゲット時系列および共変量予測変数から適切なラグおよびウィンドウ機能を特定して作成します。
  • 日付と時刻のスタンプ自体からフィーチャを作成します。
  • 予測のためにカテゴリ変数をエンコードします。
  • 休日やその他の特別なイベントをキャプチャする機能を作成します。
  • 後方および前方の充填および内挿法を使用して、時系列の欠損データを推定します。
  • 予測における外れ値を特定、除去、または捕捉することの重要性。
  • オープン ソースの Python ライブラリを使用してフィーチャを自動的に作成します。

コースの終わりまでに、データセットと予測の課題に最適な手法を決定できるようになります。Python のすべての手法を適用して、予測を改善する方法を発見できます。

データ サイエンスのキャリアを進める

データ サイエンスの最初の一歩を踏み出しました。最も一般的に使用される予測モデルについて学びます。予測を行うために、ARIMA や指数平滑法などの従来のアルゴリズムを試したことがあるかもしれません。この段階で、これらのモデルがデータに関して多くの仮定を行っていることがわかり始めるかもしれませんが、それらはまったく起こりません。あなたはニューラル ネットワークを試すことを検討しましたが、そうでなければ単純な問題に対して非常に複雑なモデルを提供します。

それが事実なのか、それとももっと適切で一般的で単純な解決策があるのか​​ 疑問に思うかもしれません。また、コードが効率的でパフォーマンスが高いかどうか、またはそれをプログラムするためのより良い方法があるかどうかも疑問に思うかもしれません。オンラインで検索しましたが、予測のための特徴量エンジニアリングに関する包括的なリソースが見つかりませんでした。もしかしてブログだけ?だからあなたは考え始めるかもしれません:業界は一体どうやってそれをやっているのですか?

このコースでは、これらの質問に対する答えを見つけることができます。コース全体を通して、従来の回帰モデルを使用して予測用の機能を作成するさまざまな方法と、Python を使用してそれらをエレガントに実装する方法を学習します。

ライブラリ Pandas、Scipy、Statsmodels、Scikit-learn、および機能エンジンやカテゴリ エンコーダーなどの機能エンジニアリング用の特別なパッケージを含む、Python のオープン ソース エコシステムの機能を活用できます。最後に、tsfresh や featuretools などのライブラリを使用して、このプロセスの自動化を開始する方法を紹介します。

コースの終わりまでに、特徴エンジニアリングのすべてのステップを単純化されたパイプラインに結合できるようになり、予測モデルを最大限の効率で本番環境に投入できるようになります。

このコースを学ぶ理由

予測特徴量エンジニアリングを学べる場所は 1 つではありません。Web を何時間も検索した後でも、統一されたアプローチとベスト プラクティスを見つけるのは困難でした。

そのために、このコースを作成しました。このコースでは、評価の高い予測書、Kaggle や KDDscientific の記事などのデータ コンテスト、およびインストラクターのデータ サイエンティストとしての経験から、世界中で使用されている機能エンジニアリングの手法の多くを照合します。したがって、このコースは、必要な機能をいつでも作成できるように、新しいメソッドについて学習し、それらとそのコードでの実装を再確認できるリファレンスです。

このコースは、金融、保険、健康、および電子商取引で機械学習を使用した経験を持つリード データ サイエンティストによって教えられます。Sole は書籍の著者でもあり、特徴エンジニアリングのためのPython オープン ソース ライブラリの主任開発者でもあります。Kishan は、応用大規模時系列分析と不整脈モデリングの物理学の博士号を持つ経験豊富な予測者です。

この包括的な機能エンジニアリング コースには、約 10 時間のビデオにまたがる 100 以上の講義が含まれており、すべてのトピックには、独自のプロジェクトで参照、練習、および再利用できる実践的な Python コードの例が含まれています。

もっとあります:

  • このコースは継続的に更新され、新しい機能エンジニアリング手法が含まれています。
  • ノートブックは定期的に更新され、最新バージョンの Python ライブラリを使用してすべてのメソッドが実行されるため、コードが壊れることはありません。
  • このコースでは、ビデオ、プレゼンテーション、Jupyter ノートブックを組み合わせて、これらのメソッドを説明し、Python での実装を示します。
  • このコースは、最新のテクニック、ツール、トレンドを提供するために、予測の分野で継続的な研究を行いながら 2 年間にわたって開発されてきました。

もっと知りたい?読み続けて…

コースには 30 日間の返金保証が付いているため、リスクなしで今日から登録できます。

何を待っていますか?今すぐ登録して、時系列予測のための世界で最も包括的な機能エンジニアリング コースに参加してください。

このコースの対象者:

  • 時系列予測のためにデータセットの前処理を開始したい学生
  • 時系列予測のための特徴量エンジニアリング手法を学びたいデータ サイエンティスト
  • 機能エンジニアリングのコーディング スキルとプログラミング プラクティスの向上を目指すデータ サイエンティスト
  • 時系列の追加の機能エンジニアリング手法を学びたいデータ サイエンティスト

Academic Fun https://xueshu.fun/ Udemy、Coursera などのオンライン教室でビデオ チュートリアルを継続的に更新します。カテゴリには、人工知能、機械学習、プログラミング言語、ゲーム開発、ネットワーク セキュリティ、クラウド コンピューティング、Linux の運用と保守が含まれます。 、面接スキルなど、コンピュータサイエンスに関するすべての知識。

すべてのビデオ チュートリアルには、中国語と英語の字幕、演習のソース コード、補足資料が含まれています。

おすすめ

転載: blog.csdn.net/duoshehuan6005/article/details/130038177
おすすめ