相関特性がonehot符号化されていないサンプル

データセット:

工具材料消費
金ナイフ100
銀斧98
銅果物ナイフ74
金鉛筆削り81本の
銅ナイフ120
金果物ナイフ99

 

インポートのNPとしてnumpyの
 インポートPDとしてパンダ
 から sklearn.linear_model インポート線形回帰
 から sklearnのインポート前処理
DF = pd.read_csv(' 1.csv '、エンコード= ' GBK ' 
DF

= pd.get_dummies cailiao(DF [ ' 材料' ])   コードonehot材料 
daojuの=のpd.get_dummiesを(DF [ ' ツール' ])     onehotエンコーディング切削工具の 
onehot = pd.concat([cailiao、daoju ] = 1軸)。    接続データマージ機能 
DF = onehot.ilocの[:、0 :. 7] .join(DF)               onehotセット元のデータに付加されたデータ 
([df.drop ' 材料'' ツール' ] 1 =軸、インプレース= TRUE)   材料、ツールのデータの2列の削除 
のDF          #の印刷

 

おすすめ

転載: www.cnblogs.com/roscangjie/p/11233669.html