Python利用pandas对Ecxel文件以某一列进行去重并保存

前言

最近接到一个需求,有一个大该有几十万条的Excel的文件,需要以某一列进行去重后并保存,下面我改了一个小测试,一起来看看吧!

在这里插入图片描述
结果
在这里插入图片描述

1、用到的库

pip install pandas

2、目录结构

文件夹:数据源–用来存放准备去重的excel(csv)文件
文件夹:–用来存放保存结果

在这里插入图片描述

3、奉上所有的代码与注释

import os

import pandas
df = pandas.read_excel("./数据源/"+os.listdir("./数据源/")[0],dtype=str,keep_default_na="")# 读取文件
df.drop_duplicates(subset=['想要删除的列名'], keep='first', inplace=True) # 以某列去重
df.to_excel("./结果/去重结果.xlsx",index=None) # 保存

希望对大家有帮助

致力于办公自动化的小小程序员一枚

致力于写出清楚的博客

都看到这了,关注+点赞+收藏=不迷路!!

猜你喜欢

转载自blog.csdn.net/weixin_42636075/article/details/128131814