根据数据仓库的实施经验,凡符合如下特征的表,建议不入仓。
① 备份数据表
此类表是对现有表中某个时点数据的一份拷贝,根据需要进行数据恢复使用。因此,只需取当前表中的数据即可。
② 冗余数据表
同一类数据在多张表中都有描述,出现冗余现象时,将从中找出最原始和最准确的源头获取数据。
③ 控制表
控制操作流程或程序处理流程等非业务类数据。
④ 派生表
在原有基础数据之上进行轻度加工而来的数据,例如简单的汇总表或接口数据表。数据仓库一般只从最源头获取最基础的数据。
⑤ 中间数据表
计算某一最终结果所需的中间过程数据,此类数据一般不入仓,只取最终的结果数据。
⑥ 临时数据表
计算某一最终结果所需的临时过程数据或开发过程中使用的表,此类数据一般不入仓,只取最终的结果数据。
⑦ 失效数据表
目前已经失去业务含义的数据表。
⑧ 数据质量差
表中存放的数据非常不准确,属性字段的取值大多没有意义或为空。
⑨ 预留表
源系统中针对某项功能预留的表,目前系统尚无此功能而未使用该表。此类表在日后业务系统使用时,可能根据业务需求而进行结构调整。
⑩ 空表
已经上线很长时间,一直无人使用的没有业务数据的表。由于此类表没有业务数据可以支持样本数据的分析,无法对表中数据的含义和质量等情况有一个全面的了解和认识,一般不入仓。
⑪ 接口表
与其他系统的接口表。