脚本小子_什么是数据处理

一、什么是数据处理
数据处理是指将杂乱的或未加工的数据源转换成有用的信息。先寻找原始数据源,并判断其价值:这些数据集的数据质量有多好?它们与你的目标是否相关?能否找到更好的数据源?在对数据进行解析与清洗后,数据集变得可用,这时你可以利用工具和方法(如Python 脚本)来帮你分析数据,并以报告的形式展示结果。这样你可以将无人问津的数据变得清晰可用

二、数据处理过程
首先提出一个问题,然后获取数据、清洗数据、探索数据、传达数据中的发现、扩展到更大的数据集,最后将整个过程自动化。这种方法可以让你从简单的问题逐步过渡到更复杂的问题和研究。

三、为什么选择python
  • 上手容易,简单明了
  • 社区活跃,类库多,避免重复造轮子
  • 数据类型不易溢出

猜你喜欢

转载自blog.csdn.net/u014795720/article/details/80773449
今日推荐