kaggle1 - 決定木

パンダの一般的な操作

  データ[「NAME1」]データ名で選択されている:NAME1の1

#データの前処理

  オフラインにdata.dropna(軸= 0)#欠損値

melbourne_features = [ '部屋' 'バスルーム' 'Landsize' 'Lattitude' '経度' ]
X = melbourne_data [ melbourne_features ]
X- DESCRIBE ()#は、データを記述します
#パーティションデータ

からsklearn.model_selectionのインポートtrain_test_split
train_X val_X train_y val_y = train_test_split X- Y random_state = 0 )乱数の結果を複製に資する#

#トレーニングデータ

  sklearn.model_selection輸入train_test_splitのから
  #モデル指定
  iowa_model = DecisionTreeRegressor(random_state = 1)を

  #トレーニングデータとフィットiowa_model。
  iowa_model.fit(train_X、train_y)

#データの将来の収集のための予測を行います

  #すべての検証観察と予測
  val_predictions = iowa_model.predict(val_X)を

エラー計算モデル#

  sklearn.metricsからインポートmean_absolute_error
  val_mae = mean_absolute_error(val_predictions、val_y)

  validation_maeの参照するには#コメントを解除し、次の行
  の印刷(val_maeを)

#あなたのモデルを最適化するために、異なるパラメータをしようとする方法を定義します。

デフget_mae(max_leaf_nodes、train_X、val_X、train_y、val_y):

モデル= DecisionTreeRegressor(max_leaf_nodes = max_leaf_nodes、random_state = 0)
model.fit(train_X、train_y)
preds_val = model.predict(val_X)
メイ= mean_absolute_error(val_y、preds_val)
リターン(メイ)

、あなたは、まあ#最終的な決定を必要としない、そのすべてのデータの検証、およびトレーニングを行います! 

おすすめ

転載: www.cnblogs.com/liu247/p/11073910.html