Pandas多表连接产生笛卡儿积(交叉表)

版权声明:版权归本作者所有,如需转载请务必注明出处及作者 https://blog.csdn.net/qq_35654046/article/details/84869941

貌似pandas自带的merge,concat,和join对笛卡儿积这个操作都不是太友好,有许多blog甚至直接写了个两重循环实现交叉表。

所以什么是笛卡儿积?

https://baike.baidu.com/item/%E7%AC%9B%E5%8D%A1%E5%B0%94%E4%B9%98%E7%A7%AF/6323173?fr=aladdin

就是从这两个表:

      

得到这个表

然而我们似乎不能直接把这两个表交叉得到我们想要的笛卡儿积,必须加入一个共同的key,才能用merge实现。

A = pd.DataFrame({'A':(1,2),'key':1})
B = pd.DataFrame({'B':('new','old'),'key':1})
AB = pd.merge(A,B,on='key')
print(AB)

猜你喜欢

转载自blog.csdn.net/qq_35654046/article/details/84869941