どのようにデータフレームのための線形回帰を作るには?

イウリアン:

私は、データフレームからのPM2.5汚染の値を予測することができますPythonでアプリケーションを構築しています。私は11月の値を使用していると私は最初の線形回帰モデルを構築しようとしています。どのように私は日付を使用せずに、線形回帰を行うことができますか?私は日付のみが知られている、PM2.5の予測を必要としています。ここで私はこれまで試したものです:

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

data = pd.read_csv("https://raw.githubusercontent.com/iulianastroia/csv_data/master/final_dataframe.csv")
data['day'] = pd.to_datetime(data['day'], dayfirst=True)

#Splitting the dataset into training(70%) and test(30%)
X_train, X_test, y_train, y_test = train_test_split(data['day'], data['pm25'], test_size=0.3,
                                                    random_state=0
                                                    )

#Fitting Linear Regression to the dataset
lin_reg = LinearRegression()
lin_reg.fit(data['day'], data['pm25'])

このコードは、次のエラーがスローされます。

ValueError: Expected 2D array, got 1D array instead:
array=['2019-11-01T00:00:00.000000000' '2019-11-01T00:00:00.000000000'
 '2019-11-01T00:00:00.000000000' ... '2019-11-30T00:00:00.000000000'
 '2019-11-30T00:00:00.000000000' '2019-11-30T00:00:00.000000000'].
Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.
StupidWolf:

これは、「[[」、そしてどのようにフラストレーションを避けるために必要がある理由に追加する他だけで何かをです。

データ[[「日」]]作品やデータ[「日」]はない理由は、Xのためのフィット法を見込んでいる形状を有する2のタプルですが、Yのために、見ていないビネットを

フィット(自己、X、Y、sample_weight =なし)[ソース]¶フィット線形モデル。

形状のパラメータX {疎行列、アレイ状}(n_samples、n_features)トレーニングデータ

yarray状(n_samples)又は(n_samples、n_targets)目標値。必要に応じて、XのDTYPEにキャストされます

例えばので:

data[['day']].shape
(43040, 1)
data['day'].shape
(43040,)
np.resize(data['day'],(len(data['day']),1)).shape
(43040, 1)

彼らは構造が必要としているため、これらの作業:

lin_reg.fit(data[['day']], data['pm25'])
lin_reg.fit(np.resize(data['day'],(len(data['day']),1)), data['pm25'])

これはいませんが。

lin_reg.fit(data['day'], data['pm25'])

そのための機能を実行する前に、あなたが必要な形式で入力を提供していることを確認してください:)

おすすめ

転載: http://43.154.161.224:23101/article/api/json?id=10264&siteId=1
おすすめ