看到这些,做好数据分析并不难(二)

版权声明:系CDA数据分析师原创作品,转载需授权 https://blog.csdn.net/yoggieCDA/article/details/85258045


在上一篇文章中我们为大家介绍了数据分析的步骤,分别包括明确目标、明确分析范围、数据采集。数据采集是数据分析工作中比较重要的东西,我们在这篇文章中给大家介绍一下剩余的内容,剩余的内容就是数据清洗、数据整理、数据对比、原因探寻、展现结果。希望这篇文章能够给大家带来帮助。

首先说一下数据清洗。当我们采集数据后,这些数据并不是直接就可以用的。因为可能会有一部分“脏数据”会污染我们的数据,进而影响我们的分析结果。这就需要进行数据清洗,将不符合要的“脏数据”清洗掉。一般“脏数据”有三种类型。分别是频率异常。频率异常就是正常用户的使用一个功能的频率一般会保持在一定范围内,不会太频繁。总数异常。比如某一个用户一个人就拉高了整个数据的水平,让某个功能点击率陡然上升。第三个行为异常,这个就比较复杂了,对应不同的业务有不同的理解。

然后就是数据整理。当我们完成数据收集后,我们需要对收集到的原始数据进行整理。因为收集出来的数据必然是比较乱的,不能直接拿来分析。整理分析分为汇总和拆分两种。汇总就是由于有些数据比较杂乱无章,我们要按照某个维度汇总才能进行效果的观察。比如:我们需要观察某个功能上线后用户行为的变化,就可以按照上线前和上线后的用户行为数据进行分类汇总,然后通过两份数据的对比来得到结论。拆分就是由于有些原始数据并不足够细致,需要我们依据数据的关系进行数据拆分。例如,一个功能的入口可能有多个,我们就需要确认每个入口的量,甚至完成整个功能的量,这些数据会让我们更加了解我们的用户行为。

数据清洗以及数据整理是数据分析中比较重要的工作内容,一般来说,数据整理和数据清理占据整个数据分析工作的大半时间,由此可见数据分析工作的重要性,我们在进行数据分析工作的时候还是得重视这两个工作内容,这样才能够为下一步的数据分析工作打好基础。以上的内容就是小编为大家解答的相关信息了,由于篇幅原因我们就给大家介绍到这里了。在下一篇文章中我们会为大家介绍更多有用的知识。

猜你喜欢

转载自blog.csdn.net/yoggieCDA/article/details/85258045