10学習パンダ:データフレームのデータ処理(アプリケーション、パケット集約を、窓組合せ、接続、合成)

これらの操作のデータフレームおよびシリーズは、ここでは、簡単に非常に似ています。

まず、アプリケーション

軸のレベル()関数を適用し、applymapは、要素レベルに適用されます。

DataFrame.apply(自己、FUNC、軸= 0、偽=生、のresult_type =なし、引数=()、** kwds)
DataFrame.applymap(自己、FUNC)

関数funの定義は、適用()関数の使用は、典型的にはポリマー楽しい機能がその機能である、行のデータフレームのオブジェクトからなる楽しい次元アレイに適用しました。

F =ラムダX:x.max() - x.min 
df.apply(F)

関数fooの定義は、使用applymap()関数foo関数は、データフレームのオブジェクトの個々の要素に適用されます

FOO =ラムダX '%.2f' %X 

df.applymap(FOO)

変換データ、関数は、データ要素の処理サイクルを呼び出します。

DataFrame.transform(自己、FUNC、軸= 0、* argsを、** kwargsから)

第二に、グループ化と集計

 データパケットをGROUPBY、パケット集約機能を直接評価と呼ばれることができ、達成するために、重合性機能に統合パケットと機能へのAGG()関数の呼び出し:

DataFrame.groupby(=なし、軸= 0、レベル=なし、as_index = Trueの場合、ソート=真、group_keys =真、スクイズ= Falseを、観察= Falseを、**による自己、kwargsから)
DataFrame.agg(自己、FUNC、軸 = 0、* argsを、** kwargsから)

第三に、窓

)(圧延する圧延評価ウィンドウに応じて、()を展開すると累積を計算する昇順を指す; EWMは、指数加重移動平均を指します。

DataFrame.rolling(自己、窓、min_periods =なし、中心=偽、win_type =なし=なしに、軸= 0、=閉鎖なし)
DataFrame.expanding(自己、min_periods = 1、センター= Falseを、軸= 0)
DataFrame.ewm(自己、COM =なし、スパン=なし、半減期=なし、アルファ=なし、min_periods = 0、=真、ignore_na = Falseを、軸= 0を調整します)

第四に、追加のデータライン

ラインデータボックスの末尾にデータを追加

DataFrame.append(自己、他の、ignore_index = Falseを、verify_integrity = Falseを、ソート=なし)

第五に、自然な接続

整合等価条件に応じて、条件に2つのデータブロックに接続された、または指標として、または同じ列名に接続されました:

DataFrame.join(自己、他の、= =どのようになし、上の' '、lsuffix = ''、rsuffix = '' ソート=偽)

パラメータ注:

  • 上:なしに設定されている場合、行インデックスが一致するようによれば、値が列に設定されている場合、マッチングは指定された列上の2つのデータフレームに基づいて行われます
  • 方法:接続のタイプは、{「右」、「外側」、「内側」、「左」}、デフォルトは「左」
  • lsuffix:同じ名前の左のフィールドのプレフィックステーブル
  • rsuffix:同じ名前の右の表Prefixフィールド

CONSOLIDATED

接続作業は、リレーショナル・データベースと同様であり、参加機能と同様に機能し、マッチング等価条件に従って、しかし参加機能を使用するよりも柔軟。

DataFrame.merge(自己、右、どのように= ' インナー'、=なし、left_on =なし、right_on =なし、left_index = Falseを、right_index = Falseを、ソート= Falseを、接尾辞=(上の' _x '' _y ')、コピー= Trueの場合、インジケータ= Falseを、検証=なし)

パラメータ注:

  • 右:右表
  • 方法:{「左」、「右」、「外側」、「内側」}、デフォルトの「内側」
  • 上:接続条件、必要なフィールドは、同じ名前によると一致します
  • left_on、right_on:フィールドに接続されている左右のテーブルの順序を指定して、フィールドが重要です
  • left_index、right_index:インデックスは、左と右の表は、試合に応じてインデックスを指定し、
  • サフィックス:タプル(STR、STR)、プレフィックスが同じ名前のフィールドの左と右のテーブルを指定するために使用されています
  • インジケータ:インジケータが増加し、Trueに設定されている場合、「_merge」を高めます
  • 検証:检查的类型マージ(「one_to_one」または「1:1」、「ONE_TO_MANY」または「1:M」、「many_to_one」または「M:1」和「many_to_many」または「M:M」)を

 

 

参照文献:

パンダデータフレーム

おすすめ

転載: www.cnblogs.com/ljhdo/p/11592735.html