パンダのデータ分析Pythonプログラミング経験の概要

APIリファレンスマニュアルパンダのデータフレームの一部:https://pandas.pydata.org/pandas-docs/stable/reference/frame.html

データ処理部:

処理されるデータ:

処理要件:1.food列、統一された場合、NaNの行2を削除し、負の値、それらをマージする前に、複合オンス値を組み合わせて同じ四つのフィールドの食品名の絶対値をとる3オンス...平均値

コードは以下の通りであります:

- * -コーディング:UTF-8 - * - 
インポートPANDAS AS PD 
DF = pd.read_csv(' E:/python3Project/11.csv ' #の印刷(DF) 
DF [ ' ' ] = DF [ ' 食品' ] .str.lower() 統一小文字の

df.dropna(インプレース = TRUE) 欠落しているデータ記録削除
印刷(DF)
DF [ ' しばらく後にあなたの手を' ] = DF [ ' あなたの手しばらく後に' ] .apply(ラムダ A:ABS (A)) 負法的ない、絶対値プリント(DF) 食品重複レコードは、平均パケット見つけ、検索
#1 (DF [ '食べ物']。重複(偽=キープ))の印刷を
#1 d_rows DF = [DF [ '食べ物']。重複(偽=キープ)] =#をキープFalseの場合、すべてのフィールドの繰り返しは、食品を見つけるために列であることを意味
#の印刷(d_rows) g_items = d_rows.groupby( '食べ物')を。意味()#はGROUPBY学ぶ
#の印刷(g_items) 食品」[g_itemsを'] = g_items.index#効果は、新たな食品である
#の印刷(g_items) 


ベーコンの最初の発生は平均置き換え 
[、0 df.locを' しばらくした後、あなたの手' DF [DF [=] ' 食品" ]。 ISIN([ ' ベーコン' ])]。平均()[ ' しばらく後にあなたの手']
 #は二オンスの削除します
df.drop(df.index [4]、インプレース= TRUE)
 印刷(DF)
df.index =レンジ(LEN(DF)) 小から大へ、コヒーレンスの順序に従って、インデックスの行に再配置された
プリント(DF)

パストラミが最初に、平均表示されます置き換える 
df.loc [0を、' あなたの手の後しばらくの間' ] = DF [DF [ ' ' ] .isin([ ' パストラミ' ])]。)(平均[ ' しばらく後に手を' ]
 第オンス削除 
df.drop(df.indexの[4]を、インプレース= TRUE)
 印刷(DF)
df.index =レンジ(LEN(DF)) コヒーレンスの順序に従って、インデックスの行に再配置され、小大型の
印刷(DF)

 

おすすめ

転載: www.cnblogs.com/zhangshitong/p/11201319.html