Import PANDA - AS PD
Import numpy AS NP
food_info = pd.read_csv ( ' food_info.csv ' )
1. Verarbeitung von fehlenden Werten (Mittelwert verwendet werden kann, wird der Modus gefüllt).
Sehen Sie sich die Daten von nicht-fehlenden Werte:
price_is_null = pd.isnull (food_info [ " Price " ])
price = food_info [ " Price " ] [price_is_null == False]
Verwenden Sie fillna, um
food_info [ ' Price ' ] .fillna (food_info [ ' Price ' ] .mean (), inplace = True)
2 Sie den Durchschnitt Wert
food_info [ """Preis " ] .mean () 3. Zeigen Sie für jede Indexstufe
den Durchschnittswert der Werte an
food_info.pivot (index = " " , values = " " , aggfunc = np.mean) an. 4. Zeigen Sie
die Gesamtzahl von
food_info.pivot (index =) an "" , values = [ "" , "" ], aggfunc = np.sum) 5. Löschen Sie
die fehlenden Werte
dropna_columns = food_info.dropna (axis = 1 )
Entfernen Sie die NaN-Zeilen in den Spalten Price und Time.
new_food_info = food_info.dropna ( Achse = 0, Teilmenge = [ " Preis " , ])
Zeit " 6. Positionieren Sie den spezifischen Wert auf 83
row_index_83_price = food_info.loc [83, " Price " ]
7. Sortieren (sort_values default aufsteigende Reihenfolge)
new_food_info.sort_values ( " Price " )
8. Ordnen Sie die Indexwerte neu und verwenden Sie reset_index
new_food_info. reset_index (drop = True)
9. Verwenden Sie die
Apply- Funktion new_food_info.apply (Funktionsname)
10. Überprüfen Sie die Anzahl der fehlenden Werte
def not_null_count (Spalte):
column_null = pd.isnull (Spalte)
# column_null ist leer Boolescher Typ
null = Spalte [column_null]
# Transferliste leer Werte zu null
return len (null)
column_null_count = food_info.apply (not_null_count)
11 Eine Hierarchie. Alter Score
DEF which_class (Row):
pClass = Zeile [ " pClass " ]
IF pd.isnull (pClass ):
return " unbekannt Ebene "
elif pClass == 1. :
return " erste Stufe "
elif pClass == 2 :
return " zweite Stufe "
elif . pClass == 3 :
return " Third Level"
new_food_info.apply (which_class, axis = 1 )
12. Verwenden Sie pivot_table, um die Pivot-Tabelle
new_food_info.pivot_table anzuzeigen (index = " " , values = " " )
2020-04-11