APIリファレンスマニュアルパンダのデータフレームの一部:https://pandas.pydata.org/pandas-docs/stable/reference/frame.html
データ処理部:
処理されるデータ:
処理要件:1.food列、統一された場合、NaNの行2を削除し、負の値、それらをマージする前に、複合オンス値を組み合わせて同じ四つのフィールドの食品名の絶対値をとる3オンス...平均値
コードは以下の通りであります:
#- * -コーディング:UTF-8 - * - インポートPANDAS AS PD DF = pd.read_csv(' E:/python3Project/11.csv ' ) #の印刷(DF) DF [ ' 食' ] = DF [ ' 食品' ] .str.lower() #統一小文字の df.dropna(インプレース = TRUE) #欠落しているデータ記録削除 印刷(DF) DF [ ' しばらく後にあなたの手を' ] = DF [ ' あなたの手しばらく後に' ] .apply(ラムダ A:ABS (A)) #負法的ない、絶対値 #プリント(DF) #食品重複レコードは、平均パケット見つけ、検索 #1 (DF [ '食べ物']。重複(偽=キープ))の印刷を #1 d_rows DF = [DF [ '食べ物']。重複(偽=キープ)] =#をキープFalseの場合、すべてのフィールドの繰り返しは、食品を見つけるために列であることを意味 #の印刷(d_rows) #g_items = d_rows.groupby( '食べ物')を。意味()#はGROUPBY学ぶ #の印刷(g_items) #の食品」[g_itemsを'] = g_items.index#効果は、新たな食品である #の印刷(g_items) #ベーコンの最初の発生は平均置き換え [、0 df.locを' しばらくした後、あなたの手' DF [DF [=] ' 食品" ]。 ISIN([ ' ベーコン' ])]。平均()[ ' しばらく後にあなたの手'] #は二オンスの削除します df.drop(df.index [4]、インプレース= TRUE) 印刷(DF) df.index =レンジ(LEN(DF)) #の小から大へ、コヒーレンスの順序に従って、インデックスの行に再配置された プリント(DF) #パストラミが最初に、平均表示されます置き換える df.loc [0を、' あなたの手の後しばらくの間' ] = DF [DF [ ' 食' ] .isin([ ' パストラミ' ])]。)(平均[ ' しばらく後に手を' ] #第オンス削除 df.drop(df.indexの[4]を、インプレース= TRUE) 印刷(DF) df.index =レンジ(LEN(DF)) #のコヒーレンスの順序に従って、インデックスの行に再配置され、小大型の 印刷(DF)