マージパラメータ
merge(
left,
right,
how="inner",
on=None,
left_on=None,
right_on=None,
left_index=False,
right_index=False,
sort=False,
suffixes=("_x", "_y"),
copy=True,
indicator=False,
validate=None,
)
パラメータ | 説明 |
---|---|
左 | 左のテーブル |
正しい | 右テーブル |
どうやって | 接続モード、内部、左、右、外部、デフォルトは内部 |
オン | 接続に使用される列名 |
left_on | 左側のテーブルを結合するために使用される列の名前 |
右に | 右側のテーブルを結合するために使用される列の名前 |
left_index | 左側のテーブルの行インデックスを接続キーとして使用するかどうか、デフォルトはFalseです |
right_index | 右側のテーブルの行インデックスを接続キーとして使用するかどうか。デフォルトはFalseです。 |
ソート | デフォルトはFalseで、マージされたデータをソートします |
写す | デフォルトはTrueで、常にデータをデータ構造にコピーし、Falseに設定するとパフォーマンスが向上します |
接尾辞 | 同じ列名が存在する場合、列名の後に追加されるサフィックス。デフォルトは( '_x'、 '_ y') |
インジケータ | 結合されたデータのデータがどのテーブルからのものかを示します |
left_onとright_onは、主に2つの接続されたテーブルの列名が異なる場合に使用されます
DataFrameにはインスタンスメソッドjoinがあります。これは、mergeメソッドのパラメーターleft_index = Trueおよびright_index = Trueと同等です。
内側、左、右、外側
連結
concatは複数のDataFrameを1つのDataFrameにスプライスできます
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0, 20, (5, 2)), columns=['A', 'B'])
print(df)
data = [df[0:2], df[3:]]
print(pd.concat(data))
追加する
Appendは行の追加に使用されますが、concatはpdの静的関数です。AppendはDataFrameのメソッドです。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0, 20, (3, 2)), columns=['A', 'B'])
print(df)
narry = np.random.randint(0, 20, (2, 2))
data = pd.DataFrame(narry, columns=['A', 'B'])
print(df.append(data, ignore_index=True))