18-09-20 关于Excel 表格重复问题解决示例

 代码实现:b=a.drop_duplicates(subset=None, keep='first', inplace=False)


Excel 去除重复项

在测试过程中,会经常遇到多张表格筛选比对的过程,筛选出的结果导入到一张新表,往往新表中会有许多重复项,我们需要清除这些重复的项,只留下唯一的项即可。
我们可以利用 pandas 库中的 drop_duplicates 方法实现。

函数用法:
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数
这个 drop_duplicate 方法是对 DataFrame 格式的数据,去除特定列下面的重复行。返回 DataFrame 格式的数据。

subset : 用来指定特定的列,默认所有列

keep : 删除重复项并保留第一次出现的项

inplace:默认 False,在原来数据上修改

猜你喜欢

转载自www.cnblogs.com/xiaoluoboer/p/9679536.html