python pandas dataframe 的去重函数

以上两个截图是对下面两个运行结果:

# data = DataFrame([1,1,2,2])#列表型

#data = DataFrame({'k':[1,1,2,2]})#字典型

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

猜你喜欢

转载自blog.csdn.net/cyzhah/article/details/81219501
今日推荐