学習データのpythonの六日目の前処理

1、削除の価値があるスペース:スペース上下のデータファイル間のアライメントを意味していない価値が,,スペース、いない空席値があります

パンダからread_csvをインポートします。

DF = read_csv( 'D://PA//4.5//data.csv')

NEWNAME = DF [ '名前'] str.strip()。

DF [ '名前'] = NEWNAME。

  2、欠損値を削除します

パンダからread_csvをインポートします。

DF = read_csv( 'D://PA//4.4//data.csv')。

newDF = df.dropna()。

  3、重複価値を削除

パンダからread_csvをインポートします。

DF = read_csv( 'D://PA//4.3//data.csv')

newDF = df.drop_duplicates()。

  

おすすめ

転載: www.cnblogs.com/manjianlei/p/11266495.html