Python数据挖掘的基础理解

版权声明:未经同意窃取和转载我的内容,如果涉及到权益问题,后果自负! https://blog.csdn.net/weixin_41605937/article/details/84787442

数据挖掘是从大量的数据中找到隐含的、先前未知的、对决策有潜在价值的关系和模式和趋势。并且利用这些知识和规则建立用于决策和支持的模型。数据挖掘有助于企业发现业务的趋势,提供决策性的支持的方法。

数据挖掘 的任务有:数据探索,数据预处理,分类和预测 聚类和分析 时序预测,关联规则挖掘 和偏差检测

大学生数据挖掘竞赛网站:(http://www.tipdm.org/ts/661.jhtml

需求分析以及系统设计相关工作;精确营销、客户分群、流失分析、 客户信用分析、欺诈发现和智能推荐等数据挖掘的应用的需求分析和设计。

实例分析:某一个知名的餐饮的连锁店

问题:遇到原材料成本升高、人力成本升高、房租等其他问题……

采用了客户管理系统:包括:客户价值分析 新客户的分析发展目的为了将其价值的情况提供给管理者为企业提供决策支持。

采用前厅管理系统:

采用了后厨管理系统:

采用财务管理系统:

采用物资管理系统:

数据挖掘建模的过程:

1定义挖掘目标:

 

2 数据取样:

抽取数据的标准:一:相关性,二可靠性,三有效性,而不是动用全部的企业数据。

衡量数据的准确的无误的标准如下:

1随抽取

2等距抽取

3分层抽取

4从起始顺序抽样

5分类抽样。

根据前面的管理系统的数据现实的:

餐饮企业信息:名称 位置 模式 联系方式 部门人员 角色等

餐饮客户信息:姓名 联系方式 消费金额 等

餐饮菜品信息:菜名 单价 成本 部门

菜品销量信息:

原材料的供应信息:供应商 联系方式 商品名称 客户评价

促销活动信息:促销日期 促销内容 促销描述

外部数据:天气  节假日 竞争对手 以及周边气氛

3数据探索:

异常值分析、缺失值分析、缺失处理、相关分析、周期性分析、

4数据预处理:

由于采样的数据维数过大如何进行降维处理。采样的数据包含很大的噪声,不完整的甚至不一致的数据。

数据预处理的过程;数据的筛选,数据变量的转换,缺失值的处理,坏数据的处理 数据标准化 主成分分析,属性选择,数据约束规范等

5挖掘建模的:

明确所属的问题(分类,聚类,关联 时序模式或者是智能推荐)

6模型的评价:

猜你喜欢

转载自blog.csdn.net/weixin_41605937/article/details/84787442