dataframe去重 drop_duplicates

data.drop_duplicates() #默认:data中一行元素全部相同时才去除
data.drop_duplicates(['a','b'])#data根据’a','b'组合列删除重复项,默认保留第一个出现的值组合。
data.drop_duplicates(['a','b'],keep='last') 传入参数keep='last'则保留最后一个,传入False则全部删除。

猜你喜欢

转载自www.cnblogs.com/bafenqingnian/p/9166741.html