【python】pandas匹配拼接两个excel列 - 代码天地

【python】pandas匹配拼接两个excel列

其他 2021-01-24 18:26:19 阅读次数: 0

在excel处理大量数据匹配过程中，虽然可以使用vlookup，但是数据量超过10万进行批量匹配的时候，效率非常差，因此使用python。经查，发现python通过pandas库的merge可以实现类似于SQL中join的功能，具体参考下文：

https://pandas.pydata.org/pandas-docs/stable/getting_started/comparison/comparison_with_sql.html#compare-with-sql-join

import pandas as pd
import numpy as np

# %%
with pd.ExcelFile('xx.xlsx') as xls:
    df1 = pd.read_excel(xls,'Sheet1')
    df2 = pd.read_excel(xls,'Sheet2')

outer=pd.merge(df1,df2,on='key')

outer.to_excel('outer_function.xlsx',index=False,encoding='utf-8')

最终实现Sheet1和Sheet2基于相同key字段的匹配，拼接。

不知道为啥，上面这个方法做出来总是有多有少，为了按顺序匹配，有遗漏的情况下我也好手动补充，采用了下面的方法，其中，结果的格式和内容顺序以df1为基础，可以方便的直接将遗漏的df1中的数据复制过来补充上。

outer=pd.merge(df1.drop_duplicates(),df2.drop_duplicates(),left_on='链接',right_on='链接',how='outer')

outer.to_excel(r'H:\e\outer_function3.xlsx',index=False,encoding='utf-8')

猜你喜欢

转载自blog.csdn.net/u010472858/article/details/106196854

【python】pandas匹配拼接两个excel列

两个excel表数据匹配

python爬取两个excel表里的相同数据并匹配输出

python两个表格字段匹配

pandas-Concat 快速合并两个excel表格

excel 将两个列的数据合并

两个excel有两列不完全相同的数据，以它们为匹配ID，使一个excel中的数据转移到另外一个excel中

python拼接两个或者多个视频文件

在Python中如何横向或纵向拼接两个表

两个excel

【Python处理EXCEL】轻办公实用篇1：通过模糊匹配算法对两个excel表格的内容进行匹配归类

使用Python将两个Excel表格按其中一列相同内容全部合并

python用符号拼接DataFrame两列

VTK 两个图像拼接

Python比较两个excel文档内容的异同

python对比两个excel表【超简单】

两个使用 Pandas 读取结构不良 Excel 的方法，拿走不谢

MySQL 把两个结果集拼接到一起（两个结果集的列一模一样）

Excel 对比两个表的相同列内容是否一致

Python之pandas学习【7】：合并两个pandas（merge）

Python之pandas学习【6】：合并两个pandas（concat）

python 将两个可迭代对象拼接成一个可迭代对象

python视频拼接两个视频流合成一个视频流

Pandas将两个sheet写入一个表格和实现任意列求和

shell合并两个文件(列)

python将两个文件中的数据拼接成一行

python中pillow切割和拼接两个图片

python批量拼接两个文件夹相同名字的图片

使用Python中pandas按照某一列把一个Excel文件拆分为多个Excel文件

两个input框的关联匹配

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)