关于数据质量的一点思考

1.重复数据
如 意外重复导入

2.历史数据
结合业务判断是否可以删除

3.数据的准确性/有效性
如 源的分析逻辑是否有漏洞,准确率可随机抽取部分数据让专业人士核查

4.数据的补齐
如 空字段是否能根据其他字段或者字典做补齐

猜你喜欢

转载自blog.csdn.net/AnlaGodness/article/details/105464434