パンダの一般的な操作
データ[「NAME1」]データ名で選択されている:NAME1の1
#データの前処理
オフラインにdata.dropna(軸= 0)#欠損値
melbourne_features = [ '部屋' 、'バスルーム' 、'Landsize' 、'Lattitude' 、'経度' ]
X = melbourne_data [ melbourne_features ]
X- 。DESCRIBE ()#は、データを記述します
#パーティションデータ
からsklearn.model_selectionのインポートtrain_test_split
train_X 、val_X 、train_y 、val_y = train_test_split (X- 、Y 、random_state = 0 )乱数の結果を複製に資する#
#トレーニングデータ
sklearn.model_selection輸入train_test_splitのから
#モデル指定
iowa_model = DecisionTreeRegressor(random_state = 1)を
#トレーニングデータとフィットiowa_model。
iowa_model.fit(train_X、train_y)
#データの将来の収集のための予測を行います
#すべての検証観察と予測
val_predictions = iowa_model.predict(val_X)を
エラー計算モデル#
sklearn.metricsからインポートmean_absolute_error
val_mae = mean_absolute_error(val_predictions、val_y)
validation_maeの参照するには#コメントを解除し、次の行
の印刷(val_maeを)
#あなたのモデルを最適化するために、異なるパラメータをしようとする方法を定義します。
デフget_mae(max_leaf_nodes、train_X、val_X、train_y、val_y):
モデル= DecisionTreeRegressor(max_leaf_nodes = max_leaf_nodes、random_state = 0)
model.fit(train_X、train_y)
preds_val = model.predict(val_X)
メイ= mean_absolute_error(val_y、preds_val)
リターン(メイ)
、あなたは、まあ#最終的な決定を必要としない、そのすべてのデータの検証、およびトレーニングを行います!