Pythonのデータデータクリーニングの処理(VI):標準化とスクリプト

1.データの正規化と標準化の

。正規化:データセットは、データが特定の範囲内にあるように、計算される\

。B標準化:

c。Deleteを外れ値

2.データストレージ

。保存SQLiteデータベース

B。エクスポートシンプルなCSVファイルに

3.データクリーニング方法を探すことは、プロジェクトに適しています

コードは、時間節約のお手伝いをして効率を向上させることができるかどうか(学習と共有し、その後の使用のために、コードの構造を決定するために)、スクリプトを書きます

4.データクリーニングは、スクリプト

4.1禅のpythonコード仕様は、コードをより明確にするために、それを参照してください

4.2は、コードの再利用可能な、より汎用的にします

4.3のコードを文書化します

主タスクリストが行われる必要があります

スクリプティング

最適化スクリプト

コメントは、インライン関数として、いくつかの文字列や文書を追加

新しいデータでテスト

同様のデータテストスクリプトを探して

内蔵テストモジュール単体テスト/鼻/ pytestライブラリー

 

おすすめ

転載: www.cnblogs.com/qiu-hua/p/12622818.html