利用Python进行数据分析---数据规整化 - 代码天地

利用Python进行数据分析---数据规整化

其他 2018-09-02 17:48:24 阅读次数: 0

1、合并数据集

①、多对一合并

我们需要用到pandas中的merge函数，merge函数默认情况下合并的是两个数据集的交集（inner连接），当然还有其他的参数：

how里面有inner、outer、left、right，四个参数可以选择，分别代表：交集，并集，参与合并的左侧DataFrame，以及右侧

当列名对象相同时：
df1=pd.DataFrame({'key':['a','c','a','b','a','c','b','c'],'data1':range(8)})
df2=pd.DataFrame({'key':['a','b','d'],'data2':range(3)})
pd.merge(df1,df2,on='key')
返回
     key  data1  data2
0    a    0    0
1    a    2    0
2    a    4    0
3    b    3    1
4    b    6    1
当列名对象不同时：
df1=pd.DataFrame({'lkey':['a','c','a','b','a','c','b','c'],'data1':range(8)})
df2=pd.DataFrame({'rkey':['a','b','d'],'data2':range(3)})
pd.merge(df1,df2,left_on='lkey',right_on='rkey'，how=‘outer’)
返回为
    
     lkey   data1 rkey    data2
0    a    0.0    a    0.0
1    a    2.0    a    0.0
2    a    4.0    a    0.0
3    c    1.0    NaN    NaN
4    c    5.0    NaN    NaN
5    c    7.0    NaN    NaN
6    b    3.0    b    1.0
7    b    6.0    b    1.0
8    NaN    NaN    d    2.0

②、多对多合并

df1=pd.DataFrame({'key':['b','c','b','a','b','a'],'data1':range(6)})
df2=pd.DataFrame({'key':['a','a','c','b','d'],'data2':range(5)})
pd.merge(df1,df2,on='key',how='right')
返回为
      key  data1 data2
0    b    0.0    3
1    b    2.0    3
2    b    4.0    3
3    c    1.0    2
4    a    3.0    0
5    a    5.0    0
6    a    3.0    1
7    a    5.0    1
8    d    NaN    4

多对多合并产生的是行的笛卡尔积，即df1有2个a,df2有2个a,并集会产生4个a

当需要根据多个键进行合并时，只要传入一个列名组成的列表就可以。

在合并运算时，需要对重复列名的处理，suffixes函数可以指定附加到左右两个DataFrame对象的重复列名上的字符串

2、索引上的合并

猜你喜欢

转载自www.cnblogs.com/jx1111jx/p/9574447.html

利用Python进行数据分析---数据规整化

【利用python进行数据分析】数据规整化：清理、转换、合并、重塑

[利用python进行数据分析书笔记]第7章数据规整化：清理、转换、合并、重塑

利用Python进行数据分析之第七章记录数据规整化:清理、转换、合并、重塑

利用python进行数据分析—9.数据规整：连接、联合与重塑

利用Python进行数据分析之第七章记录2 数据规整化:清理、转换、合并、重塑

《利用Python进行数据分析·第2版》第8章数据规整：聚合、合并和重塑

利用Python进行数据分析第8章数据规整：聚合、合并和重塑.md

利用Python进行数据分析——可视化

数据规整化：清理、转换、合并、重塑《用Python进行数据分析》读书笔记第7章

利用Python进行数据分析

《利用Python进行数据分析》

数据基础---《利用Python进行数据分析·第2版》第8章数据规整：聚合、合并和重塑

利用Python进行数据分析-Pandas(第五部分-数据规整：聚合、合并和重塑)

利用Python进行数据分析——数据清洗与准备

《利用Python进行数据分析》电影数据

《利用Python进行数据分析》 12.1 分类数据

利用python进行数据分析之数据可视化(一)

Python图书之《利用Python进行数据分析》

【利用python进行数据分析】附录A Python 学习

python学习日记——利用python进行数据分析

利用Python进行数据分析——Ipython

pandas-利用python进行数据分析

利用Python进行数据分析——pandas入门

《利用Python进行数据分析》笔记二

《利用python进行数据分析》读书笔记

思维导图-利用Python进行数据分析

利用Python进行数据分析：【NumPy】

利用Python进行数据分析：【Matplotlib】

利用Python进行数据分析：【IPython】

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)