import
pandas as pd
import numpy as np food_info = pd.read_csv(' food_info.csv ' )
1. 欠損値(平均と過半数の塗りつぶしを使用できます)を
処理して、非欠損値のデータを表示します:
price_is_null = pd.isnull(food_info [ " Price " ))
price = food_info [ " Price " ] [price_is_null == False]
fillnaを使用して
food_info [ ' Price ' ] .fillna(food_info [ ' Price ' ] .mean ()、
inplace = True)
2 平均を見つける価値food_info [ "価格" ] .mean()
。3 。各指標のレベルを見る、平均の値
food_info.pivot(インデックス = "" 、値= ""、aggfunc = np.mean)
。4 。総数見る
food_info.pivotを(index = ""、values = [ ""、"" ]、aggfunc = np.sum)
5. 欠落している値
dropna_columns = food_info.dropna(axis = 1 )
を破棄し、Price列とTime列のNaN行を削除します
。new_food_info = food_info .dropna(axis = 0、subset = [ " Price "、」時間" ])
6.特定の値を83に
配置します。row_index_83_price = food_info.loc [83、" 価格" ]
7. 並べ替え(デフォルトでは昇順の
sort_values )new_food_info.sort_values(" 価格" )
8. インデックス値を並べ替え、reset_index
new_food_infoを使用します。 reset_index(ドロップ = 真)
9。使用関数を適用。
new_food_info.apply(関数名)
10 欠損値の数を表示する。
DEF not_null_count(列):
column_null = pd.isnull(列)
#column_null空ブール
ヌル= 列[column_null]
#:
nullリストをnullに渡します。
戻り値len(null)
column_null_count = food_info.apply(not_null_count)
11. 分類:年齢グレード
def which_class(行):
pclass = row [ " Pclass " ]
if pd.isnull(pclass) :
リターン " 不明レベル"
のelif PCLASS == 1 :
リターン " 第一段階"
のelif PCLASS == 2 :
リターン " 第二段階"
のelif。PCLASS 3 ==return " Third Level"
new_food_info.apply(which_class、axis = 1 )
12 .pivot_tableを使用して、ピボットテーブルを表示します
new_food_info.pivot_table(index = " "、values = " ")
2020-04-11