用Python处理Excel中的重复行--菜鸟入门

版权声明:yangwy https://blog.csdn.net/weixin_43474731/article/details/86629220

在这里插入图片描述

从Excel表中可以看到有两条重复记录

# 导入pandas包并重命名为pd
import pandas as pd

# 读取Excel中Sheet1中的数据
data = pd.DataFrame(pd.read_excel('test.xlsx', 'Sheet1'))

# 查看读取数据内容
print(data)

# 查看是否有重复行
re_row = data.duplicated()
print(re_row)

# 查看去除重复行的数据
no_re_row = data.drop_duplicates()
print(no_re_row)

# 查看基于[物品]列去除重复行的数据
wp = data.drop_duplicates(['物品'])
print(wp)

# 将去除重复行的数据输出到excel表中
no_re_row.to_excel("过滤重复行.xlsx")

输出结果
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43474731/article/details/86629220