数据分析基本方法

一般情况下,我们所说的分析是指,使用大量数据的统计方法,定性定量分析、解释和预测以及基于事实的管理来推动决策过程与实现价值提升。
根据分析的方法和目的,数据分析可以被划分为描述性分析(descri-ptive analytics)、预测性分析(predictive analytics)和规范性分析(prescriptive analytics)。
描述性分析包括数据收集、整理、制表、制图以及描述正要研究的食物的特征,这类分析以往被称为“报告”。描述性分析可能非常有用,但它不能解释某种结果出现的原因或者未来可能会发生的事情。
预测性分析不仅可以对数据特征和变量(可以假定取消范围的因素)之间的关系进行描述,还可以基于过去的数据预测未来。预测性分析首先会确定变量值之间的关联,然后基于这种已知的关联预测另一种现象出现的可能性,比如在看到某个广告后,一位消费者可能会去买产品的可能性。虽然预测性分析中的预测是基于变量之间的关系做出来的,但这不代表预测性分析中都需要明确因果关系。事实上,准确的预测并不一定与需要基于因果关系。
规范性分析是更高层次的分析,如实验设计和优化等。就像医生会在出处方建议患者采取什么行动一样,实验设计试图通过做实验给出某些事情发生的原因。为了能够在因果关系研究中信心饱满地做出推断,研究人员必须妥善处理一个或多个独立的变量,并有效控制其他的变量。如果处于试验环境下的测试组的表现大大优于照相,决策制定者就应该立即推广这种实验环境。
优化是规范性分析采用的一种方法,指试图识别出一个特定变量和另一个变量之间理想的关系水平。例如,我们可以能会对识别最有可能让产品实现高收益的价格感兴趣。同样地,优化这种方法能够识别出使了零售企业最大限制避免缺货情况的库存水平。

根据数据收集和分析的类型,可以将数据分析分为定性分析(qualitative analysis)和定量分析(quantitative analysis)。
定性分析的目的是深入了解某种现象的根本原因和诱因。非结构化数据通常是从少数非代表性案例中收集而来,并进行了非统计性分析。
定量分析是分析的最初阶段,通常是探索性分析的有效工具,定量分析是指通过统计、数学或者计算的方式对现象进行系统的实证研究。通常情况下,结构化数据是从大量典型案例中收集而来,并进行统计分析。
同时包括以下几种类型的分析:
统计学:收集、整理、分析、说明和呈现数据的学科;
预测:根据已有数据,预测一下一些感兴趣的变量在未来某个特定的时间点的情况;
数据挖掘:通常使用算法和统计技术,自动或半自动地提取大量数据中未知的有趣模式;
文字挖掘:用类似数据挖掘的方式从文本中得模式和趋势的过程;
优化:在同时满足约束条件的情况下,按照某些标准利用数学方法来寻找最优的解决方案;
实验设计:给各组随机分配被试。然后使用测试组和对照组来推导出特定结果中存在的因果关系。

虽然此处给出了一些列常用的分析方法,但在使用过程中会不可避免地出现相当大的重叠。例如,回归分析(regression analysis)是预测分析中最常用的方法,与此同时,它也是统计学、预测和数据挖掘中常用的方法。此外,时间序列分析(time seties analysis)是用于分析数据随时间变化的一种具体统计方法、在统计学和预测中经常被用到。

猜你喜欢

转载自blog.csdn.net/qq_46009608/article/details/112862686