パンダのマージ方法の詳細説明

マージパラメータ

merge(
    left,
    right,
    how="inner",
    on=None,
    left_on=None,
    right_on=None,
    left_index=False,
    right_index=False,
    sort=False,
    suffixes=("_x", "_y"),
    copy=True,
    indicator=False,
    validate=None,
)
パラメータ 説明
左のテーブル
正しい 右テーブル
どうやって 接続モード、内部、左、右、外部、デフォルトは内部
オン 接続に使用される列名
left_on 左側のテーブルを結合するために使用される列の名前
右に 右側のテーブルを結合するために使用される列の名前
left_index 左側のテーブルの行インデックスを接続キーとして使用するかどうか、デフォルトはFalseです
right_index 右側のテーブルの行インデックスを接続キーとして使用するかどうか。デフォルトはFalseです。
ソート デフォルトはFalseで、マージされたデータをソートします
写す デフォルトはTrueで、常にデータをデータ構造にコピーし、Falseに設定するとパフォーマンスが向上します
接尾辞 同じ列名が存在する場合、列名の後に追加されるサフィックス。デフォルトは( '_x'、 '_ y')
インジケータ 結合されたデータのデータがどのテーブルからのものかを示します

left_onとright_onは、主に2つの接続されたテーブルの列名が異なる場合に使用されます

DataFrameにはインスタンスメソッドjoinがあります。これは、mergeメソッドのパラメーターleft_index = Trueおよびright_index = Trueと同等です。

内側、左、右、外側

接続方法

連結

concatは複数のDataFrameを1つのDataFrameにスプライスできます

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(0, 20, (5, 2)), columns=['A', 'B'])
print(df)

data = [df[0:2], df[3:]]
print(pd.concat(data))

追加する

Appendは行の追加に使用されますが、concatはpdの静的関数です。AppendはDataFrameのメソッドです。

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(0, 20, (3, 2)), columns=['A', 'B'])
print(df)

narry = np.random.randint(0, 20, (2, 2))
data = pd.DataFrame(narry, columns=['A', 'B'])
print(df.append(data, ignore_index=True))

おすすめ

転載: blog.csdn.net/trayvontang/article/details/103787648