数据挖掘的一般步骤

    最近由于做游戏玩家流失预测的分析,数据挖掘刚入门,梳理一下。

    一般步骤为:

  1. 确定预测目标。
  2. 统计数据特征,如平均值、分布、随着时间变化等等。
  3. 根据数据特征进行数据预处理:数据清洗、数据缺失值处理、数据变换、特征构造、特征归约、特征选择等。
  4. 应用数据挖掘模型(分类、聚类、关联分析、离群点挖掘、标记等)。
  5. 分析模型的准确率。
  6. 找出影响模型准确率的因素,回到第3不迭代直到模型足够完美。

猜你喜欢

转载自yangchildren.iteye.com/blog/2252573