【数据挖掘、机器学习】

数据挖掘流程

1.数据读取

读取数据,并进行展示

统计数据各项指标

明确数据规模和要完成的任务

2.特征理解分析

单特征分析,逐个变量分析其对结果的影响

多变量统计分析,综合考虑多种情况影响

统计绘图得出结论

3.数据清洗与预处理

对缺失值进行填充

特征标准化,归一化

扫描二维码关注公众号,回复: 16836826 查看本文章

筛选有价值的特征

分析特征之间的相关性

4.建立模型

特征数据与标签准备

数据集切分

多种建模算法对比

集成策略等方案改进

所需库:sklearn,numpy,pandas,matplotlib,seaborn,scikit-learn

猜你喜欢

转载自blog.csdn.net/David_Hzy/article/details/132791587