数据挖掘流程
1.数据读取
读取数据,并进行展示
统计数据各项指标
明确数据规模和要完成的任务
2.特征理解分析
单特征分析,逐个变量分析其对结果的影响
多变量统计分析,综合考虑多种情况影响
统计绘图得出结论
3.数据清洗与预处理
对缺失值进行填充
特征标准化,归一化
扫描二维码关注公众号,回复:
16836826 查看本文章
筛选有价值的特征
分析特征之间的相关性
4.建立模型
特征数据与标签准备
数据集切分
多种建模算法对比
集成策略等方案改进
所需库:sklearn,numpy,pandas,matplotlib,seaborn,scikit-learn