python 数据合并之join

  个人觉得数据框合并最简单的莫过于join,一个小函数却有大作用。具体介绍:

DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)

other:一个DataFrame、Series(要有命名),或者DataFrame组成的list。
on:列名,包含列名的list或tuple,或矩阵样子的列
    (如果是多列,必须有MultiIndex)。
    跟上面的几种方法一样,用来指明依据哪一列进行合并。
    如果没有赋值,则依据两个数据框的index合并。
how:合并方式, {‘left’, ‘right’, ‘outer’, ‘inner’},
    默认 ‘left’调用函数的数据框。
lsuffix:字符串。用于左侧数据框的重复列。
    把重复列重新命名,原来的列名+字符串。
    【如果有重复列,必须添加这个参数。】
rsuffix:同上。右侧。
sort:布尔型,默认False。如果为True,将链接键(on的那列)按字母排序。

其实,在应用过程中,挺简单的。

只有index一致,直接用 df1.join(df2) 就OK了!

猜你喜欢

转载自blog.csdn.net/wojiaodabai/article/details/89115352