python 如何用pandas合并相同数据？ - 代码天地

python 如何用pandas合并相同数据？

编程语言 2023-07-01 12:50:32 阅读次数: 0

在数据分析中，我们常常需要将不同的数据表中的相同数据进行合并。Pandas提供了简单易用的方法来实现这个功能。本文介绍如何使用Pandas的groupby和aggregate方法合并相同的行数据。

假设我们有两张数据表:

python
df=pd.DataFrame([['AAA'，3]，['BBB'，4]，['CCC'，5]，['AAA'，8]，['CCC'，9]]，columns=['item'，'num'])
df1=pd.DataFrame([['AAA'，11]，['BBB'，4]，['CCC'，14]]，columns=['item'，'num'])

我们要将df和df1按item列合并，得到的结果为:

   item  num
0  AAA   11 
1  BBB    4
2  CCC   14

## 分组聚合
首先，我们使用`.groupby()`对df和df1进行分组，分组键为item列:

python
df_grouped = df.groupby('item')  
df1_grouped = df1.groupby('item')

然后，使用`.aggregate()`选择num列求和，得到两张分组求和后的DataFrame:

python
df_sum = df_grouped['num'].aggregate(np.sum)
df1_sum = df1_grouped['num'].aggregate(np.sum)

## 拼接表格
我们重命名df_sum为df，df1_sum为df1_sum，然后使用`pd.concat()`方法按item列拼接:

python
df = df_sum.reset_index()  
df1_sum = df1_sum.reset_index()
result = pd.concat([df， df1_sum]， ignore_index=True)

此时的result表格有重复行，我们使用`.drop_duplicates()`删除重复行，并重命名列名:

python
result = result.drop_duplicates(['item'])  
result = result.rename(columns={'num_x': 'num'， 'num_y': 'num'})

## 完整代码

python 
df_grouped = df.groupby('item')  
df_sum = df_grouped['num'].aggregate(np.sum)
df = df_sum.reset_index()  

df1_grouped = df1.groupby('item')  
df1_sum = df1_grouped['num'].aggregate(np.sum)  
df1_sum = df1_sum.reset_index()

result = pd.concat([df， df1_sum]， ignore_index=True)  
result = result.drop_duplicates(['item'])
result = result.rename(columns={'num_x': 'num'， 'num_y': 'num'})

通过上述方法，我们成功实现了使用Pandas合并两个数据表中相同行数据的功能。我们只需要数行代码，便可以轻松处理表格合并的任务。

猜你喜欢

转载自blog.csdn.net/devid008/article/details/131409394

python 如何用pandas合并相同数据？

如何用Python和Pandas分析犯罪记录开放数据？

如何用 Python 和 Pandas 分析犯罪记录开放数据？

Python数据分析：pandas数据合并

python、pandas文件合并、数据去重

python -- 数据合并，pandas里的merge函数

python学习——pandas 数据合并与重塑

如何用python创建数据库

Python如何用filter函数筛选数据

App的数据如何用python抓取

如何用Python读取Amazon的Review数据

python数据分析之pandas（8）数据合并

Python Pandas 数据合并/融合 merge 数据过滤 isin

Python数据分析——numpy与pandas数据合并

Python Pandas join 连接参数详解数据合并数据拼接

Python Pandas merge 连接参数详解数据合并数据拼接

Python~PANDAS 数据合并与重塑（concat篇）

Python数据处理之（十六）Pandas 合并merce

Python数据处理之（十五）Pandas 合并concat

Python pandas合并Excel多个Sheet表数据

6、Python 数据分析-Pandas级联与合并

Python-pandas：数据合并merge函数用法详解

python中pandas的series合并

如何用Python画画

pandas 如何实现将数值按照前几位是否相同来聚合？(python)

如何用python将两个文件夹合并至另一个文件夹（制作数据集）

python数据分析十二：pandas多个矩阵的索引合并(merge的索引合并方法详解)

python合并字典，相同的key的value如何相加结合函数定义，类，OOP

一款IP区间合并工具及如何使用Python实现相同功能!

一款IP区间合并工具及如何使用Python实现相同功能

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)