パンダレビュー2

import 
pandas as pd
 import numpy as np food_info = pd.read_csv(' food_info.csv '  1. 欠損値(平均と過半数の塗りつぶしを使用できます)を
    処理して、非欠損値のデータ表示します:
        price_is_null = pd.isnull(food_info [ " Price " ))
        price = food_info [ " Price " ] [price_is_null == False] 
    fillnaを使用して
        food_info [ ' Price ' ] .fillna(food_info [ ' Price ' ] .mean ()、
    inplace = True)
 2 平均を見つける価値food_info [ "価格" ] .mean()
。3 。各指標のレベルを見る、平均の値
    food_info.pivot(インデックス = "" 値= ""、aggfunc = np.mean)
。4 。総数見る
    food_info.pivotを(index = ""、values = [ """" ]、aggfunc = np.sum)
 5. 欠落している値
    dropna_columns = food_info.dropna(axis = 1 破棄し、Price列とTime列のNaN行を削除します
        。new_food_info = food_info .dropna(axis = 0、subset = [ " Price "時間" ])
 6.特定の値を83に 
    配置します。row_index_83_price = food_info.loc [83、" 価格" ]
 7. 並べ替え(デフォルトでは昇順の
    sort_values new_food_info.sort_values(" 価格"  8. インデックス値を並べ替え、reset_index 
    new_food_infoを使用します。 reset_index(ドロップ = 真)
 9。使用関数を適用。
    new_food_info.apply(関数名)
 10 欠損値の数を表示する。
     DEF not_null_count(列):
        column_null = pd.isnull(列)
         column_null空ブール 
        ヌル= 列[column_null]
        nullリストをnullに渡します。
        戻り値len(null)
    column_null_count = food_info.apply(not_null_count)
 11. 分類:年齢グレード
     def which_class(行):
        pclass = row [ " Pclass " ]
         if pd.isnull(pclass) :
             リターン " 不明レベル" 
        のelif PCLASS == 1 リターン " 第一段階" 
        のelif PCLASS == 2 リターン " 第二段階" 
        のelif。PCLASS 3 ==return  " Third Level" 
    new_food_info.apply(which_class、axis = 1  12 .pivot_tableを使用して、ピボットテーブルを表示します
    new_food_info.pivot_table(index = "  "、values = "  "

2020-04-11

おすすめ

転載: www.cnblogs.com/hany-postq473111315/p/12677896.html