数据挖掘与建模

1、数据挖掘建模过程

2、数据取样

数据取样标准:相关性、可靠性、有效性,不一定要动用全部企业数据,通过对样本数据的精选,能减少数据处理量,节省系统资源,更好显现数据的规律性。

衡量取样数据质量的标准:

  • 资料完整无缺,各类指标齐全;
  • 数据准确无误,反映的都是正常状态下的水平

3、数据探索

异常值分析、缺失值分析、相关分析、周期性分析等

4、数据预处理

数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约等

猜你喜欢

转载自www.cnblogs.com/Iceredtea/p/12047505.html