マシントレインモデルに学習、予測データを使用する場合は、そことValueError:FEATURE_NAMEに不一致:

 

フォームのエラー

ValueError:FEATURE_NAMEに不一致:[ "F1"、 "F2"、 "F3"、 "F4"、 "F5"、 "F6"、...... "f60123"、]

 

原因分析

- インターネットBaiduは、ほとんどの答えは次のとおりです。

  1. 列名のトレーニングとテストセットは矛盾しています
  2. カラム名の順序の一貫性のないトレーニングとテストセット

 そこに2つです以上変更しようとする可能性がある場合

 

- 私は別の遭遇しました:

  場合トレーニングデータセットは、変換機能:TfidfVectorizer、再利用その他のデータは、時間をテストすること、ベクトルの次元を無視し、したがってより多くの誤差よりもありました。

 

ソリューション:

前記モデルTfidfVectorizerは、同じ寸法のベクトルを生成し、次の呼び出しを容易にするために、保存時に変換が行われます

#シーケンス保全
tfidftransformer_path = './tfidftransformer.pkl' 
オープンと(tfidftransformer_path、 'WB')ファイルAS:
        pickle.dump(tfidf_transformer、ファイル)

#ロード保存されたモデル

tfidftransformer_path = './tfidftransformer.pkl' 
tfidftransformer漬物= .LOAD(オープン(tfidftransformer_path、 "RB "))

  

  

時間の同じベクトルの次元では、予測のための分類器に入力することができます

 

おすすめ

転載: www.cnblogs.com/harp-yestar/p/xgboost_question.html