E家数据挖掘计划书_按照crisp-dm规划

E家数据挖掘计划书

一、商业理解(11.24)

1.确定数据挖掘目标

建立e家客户响应规则集;

2.数据挖掘成功标准

用规则集来评价新增用户,或是其他非e家客户,耦合程度大的定义为潜在e家用户,对其实行针对性营销的成功概率希望为15%以上。

3.工具技术

数据挖掘工具SPSS_clementine

4.制定项目计划

二、数据理解(11.25-11.26)

1.原始数据收集

输出:获得要列入数据挖掘项目资源的数据,客户基本信息表,客户费用基本信息表,产品基本信息表的数据,以及必要的数据加载和导入方式;

2.数据描述

输出:描述数据格式和数据质量给出结果报告,包括表的记录总数,字段数,字段的标识

3.数据探索

对字段的初步发现和理解以及对后续阶段的影响;

4.数据质量

数据的完整性,数据正确性,有无缺省值

三、数据准备(11.27-11.28)

3.1数据选择 与数据挖掘目标的相关性,被包含进来的字段和被排除的字段和理由;

3.2数据清洗 保证数据质量 :缺失值的插入,通过建模评估缺省值

3.3构造数据 关于衍生字段的属性确定问题(可选)

3.4整合数据 对象:客户基本信息表,客户费用基本信息表,产品基本信息表的的整合

输出:数据集,该数据集含有完整的需要挖掘的字段以及记录,数据类型确定,完整性好,可以直接提供给数据挖掘工具进行分析;

四、建模(12.1-12.5)

4.1选择建模技术:C5决策树;

4.2生成测试设计 :设置数据抽样,将其分为训练数据和检验数据,检验数据用于后期的模型评估;

4.3建立模型 

输出:

参数设置,对应字段需要调整的参数和设置值,选择这些参数的基本原则;

模型:生成的实际模型;

模型描述:对模型中生成的规则集进行描述和总结;

模型评估:用检验数据来进行检验,评估模型的准确率;

五、评价

评价:模型适合商业目标的程度

注:改计划书以CRISP-DM数据挖掘标准流程为指导。

猜你喜欢

转载自blog.csdn.net/lijieneptune/article/details/3789596
今日推荐