数据分析流程
5个步骤:
- 现象vs预期
- 发现问题
- 数据收集和加工
- 数据分析
- 解决对策
现象vs预期
现象是什么?预期是什么?现象与预期之间的差距。
发现问题
怎么理解差距?
- 观察数据大小
- 数据分解:因数分解
- 数据比较
数据收集和加工
收集:
- 文件
- 数据库
- Hadoop
加工:
- 生成判定变量(有或无)
- 生成离散变量:将连续数据划分为离散数据
数据分析
分两类:
- 决策支持:简单求和、交叉列表
- 自动化、最优化:机器学习、算法
解决对策
End here.
5个步骤:
现象是什么?预期是什么?现象与预期之间的差距。
怎么理解差距?
收集:
加工:
分两类:
End here.