昨天,学习了python遍历目录,今天就开始合并多个excel表格了。我将对昨天的函数加以改造以实现目标。
如下图所示:
如上图所示,总共有三张表,目标是合并成如下的excel表。
如代码所示:
import os
import pandas as pd
# 输入参数为excel表格所在目录
def to_one_excel(dir):
dfs = []
# 遍历文件目录,将所有表格表示为pandas中的DataFrame对象
for root_dir, sub_dir, files in os.walk(r'' + dir):
for file in files:
if file.endswith('xlsx'):
# 构造绝对路径
file_name = os.path.join(root_dir, file)
df = pd.read_excel(file_name)
dfs.append(df)
# 行合并
df_concated = pd.concat(dfs)
# 按照name去重
df_concated.drop_duplicates(subset=['name'], keep='first', inplace=True)
# 构造输出目录的绝对路径
out_path = os.path.join(dir, 'res.xlsx')
# 输出到excel表格中,并删除pandas默认的index列
df_concated.to_excel(out_path, sheet_name='Sheet1', index=None)
# 调用并执行函数
to_one_excel('D:/myExcel')
哈哈,以上就是遍历合并多个excel的方法,如果有什么不懂的地方可以查看我之前的文章或者给我留言,乐意效劳。还是建议大家认真阅读pandas官方文档,或者关注我的公众号: python小工具。回复python,我都下载好了。让我们一起努力,让办公变的更简单吧