python利用pandas合并多张excel表(二)

昨天,学习了python遍历目录,今天就开始合并多个excel表格了。我将对昨天的函数加以改造以实现目标。
如下图所示:
在这里插入图片描述
如上图所示,总共有三张表,目标是合并成如下的excel表。
在这里插入图片描述
如代码所示:

import os
import pandas as pd

# 输入参数为excel表格所在目录
def to_one_excel(dir):
    dfs = []
    # 遍历文件目录,将所有表格表示为pandas中的DataFrame对象
    for root_dir, sub_dir, files in os.walk(r'' + dir):
        for file in files:
            if file.endswith('xlsx'):
            	# 构造绝对路径
                file_name = os.path.join(root_dir, file)
                df = pd.read_excel(file_name)
                dfs.append(df)
    # 行合并
    df_concated = pd.concat(dfs)
    # 按照name去重
    df_concated.drop_duplicates(subset=['name'], keep='first', inplace=True)
    # 构造输出目录的绝对路径
    out_path = os.path.join(dir, 'res.xlsx')
    # 输出到excel表格中,并删除pandas默认的index列
    df_concated.to_excel(out_path, sheet_name='Sheet1', index=None)

# 调用并执行函数
to_one_excel('D:/myExcel')

哈哈,以上就是遍历合并多个excel的方法,如果有什么不懂的地方可以查看我之前的文章或者给我留言,乐意效劳。还是建议大家认真阅读pandas官方文档,或者关注我的公众号: python小工具。回复python,我都下载好了。让我们一起努力,让办公变的更简单吧
在这里插入图片描述


发布了13 篇原创文章 · 获赞 1 · 访问量 210

猜你喜欢

转载自blog.csdn.net/weixin_45144170/article/details/104423212