数据清洗(一)-----------重复数据处理

数据处理

(一)重复数据的处理

(1)函数法:COUNTIF(range,criterial)

range:要计数的单元格范围

criterial:计算条件

eg:A列:员工编号;B列:每个员工编号出现的次数;C列:查找出现两次及其以上的重复项,以C9为例,即表示A466074从A1到A9是第3次重复出现。


(2)高级筛选法:

a.选择数据单元格区域A1::11

b.开始---筛选---高级筛选---选择“将筛选结果复制到其他位置”---在复制到文本框输入另一个存放的区域---勾选“选择不重复记录”复选框---单击确定按钮



(3)条件格式法

选择单元格区域---开始---条件格式---突出显示单元格规则---重复值---将重复值和所在单元格标为不同颜色







(4)数据透视表法

用数据透视表统计各数据出现的频次,出现两次及以上就说明该数据属于重复项,若统计结果为1这说明该数据没有重复出现。

a.单击“插入”选项卡---单击“数据透视表”按钮---在弹出的是“数据透视表”对话框“选择一个表或区域”中,选择数据源单元格范围



b.将“编号”字段拖至行标签---再将“编号”字段拖至数值汇总区域




由以上可知,高级筛选法和数据透视表最便捷。


(二)删除重复数据

(1)通过菜单操作删除重复项

a.选择A1::11区域---数据选项卡---单击删除重复项---在“列”区域下选择要删除的列---单击确定





(2)排序删除重复项

利用前面的COUNTIF系列的第二次重复标记,先排序,然后删掉大于1的行就行


(3)筛选删除重复项









猜你喜欢

转载自blog.csdn.net/cmz1243018/article/details/80037823
今日推荐