CHANG PM2.5を予測するための線形回帰

職務記述書

  与えられたトレーニングセットPM2.5のtrain.csvの内容は、予測は、10時間の最初の9時間で空気のモニタリングを必要とします。

トレーニングセットの説明:

  (1):CSVファイル、240日台湾豊原地区などの気象データ(20日間トレーニングデータセットを行うには、月服用する前に、12月X20日数= 240日、10日の試験のための月次データの後に、学生は)表示されません。

  (2):毎日の監視時間は0、... 23場合、ノード1 24の合計時間です。

  (3):曜車はCO、NO、PM2.5、PM10及び18の合計、雨、風および他の気象情報かどうか、などを検出するガス濃度を含みます。

       (4):データセットhttps://github.com/datawhalechina/leeml-notes/blob/master/docs/Homework/HW_1/Dataset

 

データ処理

【下記の「データフレーム」は、データ構造を指すDATAFRAMEないパンダのライブラリーを行い、むしろ二次元のデータ・パケットを指します]

見かけの運用上の要件は、10ポ​​イントの時間PM2.5の内容を予測することが9つの連続したタイムポイントの気象観測データを使用する必要があります。それのために毎日、それに含まれる情報は、ディメンション(18、24)(18のインジケータ、24時間ノード)です。データ0-8で切り捨てられることがあります

トレーニングデータは、ラベルに対応するように取り出し、一次元(18,9)データ・フレームに形成され、訓練データとして、PM2.5 9の内容は、取り出され、トレーニングなど1-9同様に望ましい場合にデータデータフレームと、PM2.5のラベルの内容このとして10 ......

セグメンテーション、日情報15(18,9)の形状と対応するデータフレーム15ラベルに分割することができます。

 

おすすめ

転載: www.cnblogs.com/baobaotql/p/11401719.html