谁说菜鸟不会数据分析(入门篇)----- 学习笔记1(数据分析基本概念)

1、何谓数据分析

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这里的数据也称观测值,是通过实验、测量、观察、调查等方式获取的结果,常常以数量的形式展现出来。

数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结所研究对象的内在规律。实际工作中,数据分析能帮助管理者进行判断和决策,以便采取适当策略与行动。

描述性总计分析:初级数据分析,分析方法:对比分析法、平均分析法、交叉分析法

高级数据分析:探索新数据分析:侧重于在数据之中发现新的特征

                               验证性数据分析:侧重于验证已有假设的真伪;相关分析、因子分析、回归分析

2、数据分析作用

(1)现状分析:告诉你过去发生了什么。一般通过日常通报来完成,日报、周报、月报等形式

i:    告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明企业整体运营是好了还是坏了,好的程度如何,坏的程度如何

ii:   告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营状况有更深入的了解

(2)原因分析:告诉你某一现状为什么发生。一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。

通过第一阶段的现状分析,对企业运营情况有基本了解,但不知运营情况具体好在哪里,差在哪里,是什么原因引起的。这时需要开展原因分析,进一步确定业务变动的具体原因。

(3)预测分析:告诉你将来会发生什么。一般通过专题分析来完成,通常在制定企业季度、年度等计划时进行,其开展的频率没有现状分析及原因分析高。

了解企业运营现状后,还需对企业未来发展趋势作出预测,为制订企业运营目标及策略提供有效的参考与决策依据,保证企业的可持续健康发展。

3、数据分析六部曲:六者相互独立相互联系

(1)明确分析目的和思路,是确保数据分析过程有效进行的先决条件,可为数据的收集、处理及分析提供清晰的指引方向。

i:    明确分析目的:两者区别在于分析目的不明确。在开展数据分析前,需要思考:为什么开展数据分析?通过数据分析我要解决什么问题?只有明确数据分析的目标,数据分析才不会偏离方向,否则得出的数据分析结果不仅没有指导意义,甚至将决策者引入歧途,后果严重。

ii:   确定分析思路 :分析目的明确后,梳理分析思路并搭建分析框架(体系化),把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从那几个角度进行分析,采用哪些分析指标,使分析结果具有说服力。

体系化:即逻辑化,先分析什么,后分析什么,使得各个分析点之间具有逻辑联系,让分析框架具有说服力。

如何使分析框架体系化:就是以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,才能确保数据分析维度的完整性,分析结果的有效性及正确性。

营销方面的理论模型有4P、用户使用行为、STP理论、SMART原则等。

(2)数据收集:为数据分析提供素材和依据。

第一手数据:直接获取的数据

第二手数据:经过加工整理后得到的数据

i:    公司

ii:    中国统计年鉴   中国社会统计年鉴  中国人口统计年鉴  世界经济年鉴  世界发展报告

iii:   国家及地方统计局网站、行业组织网站、政府机构网站、传播媒体网站、大型综合门户网站

iiii:   进行数据分析时,需要了解用户的想法与需求,但是通过以上三种方式获得此类数据会比较困难,可尝试使用市场调查的方法收集用户的想法和需求数据。市场调查就是运用科学的方法,有目的、有系统地收集、记录、整理有关市场营销的信息和资料,分析市场情况,了解市场现状及其发展趋势,为市场预测和营销决策提供客观、正确的数据资料。市场调查可以弥补其他数据收集方式的不足,但进行市场调查所需的费用较高,且存在一定的误差,故仅作参考之用。

(3)数据处理:是数据分析的前提,对有效数据的分析才是有意义的

数据处理是对收集到的数据进行加工整理,形成适合数据分析的样式,它是数据分析前必不可少的阶段。数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。一般拿到手的数据都需要进行一定的处理才能用于后续的数据分析工作,即使再“干净”的原始数据也需要进行一定的处理才能使用。

(4)数据分析

数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。

i:数据分析和数据处理的区别

数据处理是数据分析的基础。通过数据处理,将收集到的原始数据转换为可以分析的形式,并且保证数据的一致性和有效性。如果数据本身存在错误,那么即使采用最先进的数据分析方法,得到的结果也是错误的,不具备任何参考价值,甚至还会误导决策。

ii:数据分析与数据挖掘的关系

数据挖掘是一种高级的数据分析方法。数据挖掘就是从大量的数据中挖掘出有用的信息,它是根据用户的特定要求,从浩如烟海的数据中找出所需的信息,以满足用户的特定需求。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。一般来说,数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。

数据分析与数据挖掘的本质是一样的,都是从数据里面发现关于业务的知识。

(5)数据展现

数据分析师在展现结果的时候一定要保证绝大部分人的理解是一致的。数据通过图表(图形和表格)的方式呈现出来。能用图说明问题的就不用表格,能用表格说明问题的就不用文字。

(6)报告撰写

数据分析报告其实是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。所以,数据分析报告是通过对数据全方位的科学分析来评估企业的运营质量,为决策者提供科学、严谨的决策依据,以降低企业运营风险,提高企业核心竞争力。

好的报告:结构清晰,主次分明,图文并茂;需要有明确的结论,没有明确结论的分析称不上分析,同时也失去了报告的意义。同时要有建议或解决方案。

4、数据分析的三大误区

(1)分析目的不明确,为分析而分析

数据分析不是为了分析而分析,应该围绕分析目的(了解现状、找出业务变动原因、预测发展等)而进行分析。

(2)缺乏业务知识,分析结果偏离实际

在企业中所作的数据分析不是纯数据分析,而是需要多从业务方面进行分析,不应停留在数据表面,要考虑数据背后的事实与真相,使得分析结果更加切合实际,为老板的决策提供有力的支撑,否则就是纸上谈兵。数据分析师的任务不是单纯做数学题,数据分析师还必须懂营销,管理策略。

(3)一味追求使用高级分析方法,热衷研究模型

数据分析的最终目的是围绕业务问题并解决问题。

五懂:懂业务、懂管理、懂分析、懂工具、懂设计

5、常用指标和术语

(1)平均数:将总体内各单位的数量差异抽象化,代表总体的一般水平,掩盖了总体内各单位的差异。

(2)绝对数和相对数:绝对数就是数量(quantity),相对数就是质量(quality),进行数据分析时,都可从这两个角度进行分析,简称QQ模型。

绝对数反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标。也可表现为在一定时间、地点条件下数量增减变化的绝对数。

相对数:由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。

(3)百分比与百分点

百分比:相对数中的一种,表示一个数占另一个数的百分之几

百分点:不同时期以百分数形式表现的相对指标的变动幅度。

(4)频数(绝对数)和频率(相对数)

频数:一组数中个别数据重复出现的次数。

频率:每组类别与总次数的比值,代表某类别在总体中出现的频繁程度。

(5)比例和比率(相对数)

比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成个结构。

比率是指不同类别数值的对比,反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。

(6)倍数和番数(相对数)

倍数:一个数除以另一个数所得的商。倍数一般表示数量的增长或上升幅度,不适用于表示数量的减少或下降

番数:指原来数量的2的N次方倍    1番=2倍   2番=4倍

(7)同比与环比

同比:指与历史同时期进行比较得到的数值,反映事物发展的相对情况。2010年12月与2009年12月相比

环比:与前一统计期进行比较得到的数值,反映事物逐期发展情况。2010年12月与2010年11月相比

6、数据分析三字经

猜你喜欢

转载自blog.csdn.net/mengjizhiyou/article/details/82789168