人人都能掌握的6个数据分析工具

原文链接:https://www.ctocio.com/ccnews/11262.html

data-scientist

 

大数据时代人人都拥有数据, 但是提到数据分析,听起来似乎是专家才能做的事情。确实, 如果你想成为数据科学家, 那么好好学习机器学习、Hadoop和R吧。 不过如果你只是想简单地做些分析,那么还是有一些学习曲线不那么陡峭的“傻瓜”工具可用,以下是GigaOM的博客作者Derrick Harris推荐的6款免费在线数据分析工具,IT经理网为大家试用点评如下:

 

BigML

BigML是一个机器学习的工具。 如果拿数码摄影做类比, BigML使用起来简单得就像傻瓜相机那样, 同时有具备了单反的功能。 用户只需要上传数据, 格式化数据, 然后BigML就根据这些变量生成一个预测模型。 就这么简单。 下图就是Derrick Harris根据自己在用健康应用App软件Fitbit统计出来自己一天的活动数据和消耗的卡路里, BigML做出的预测模型。

clip_image002

clip_image004

 

Google Fusion Table 

 

Google Fusion Table 是Google的一个实验性数据可视化工具。 用户界面算不上多好, 不过使用非常简单。下图就是Derrick Harris把公开的各国枪支犯罪的数据上传上去得出的可视化地图。

clip_image006

对每个国家, 点击后可以看到具体数据:

clip_image008

Infogram

如果你的数据量不大, 比如列数和行数不多的话。 Infogram 是个不错的可视化选择。 Infrogram最初提供信息图的模板, 而去年又开始增加了大量的图表的模板。用户上传数据后, 可以生成互动的图表, 这些图表可以嵌入网页使用。

此外, Infogram还提供了一些样本数据供用户试验。 用户可以看这些样本数据生成的图表, 如果喜欢的话, 可以用自己的数据替换。

下图是本站编辑根据本站的文章“GE的千亿美元数据转型”进行词频分析并用Infogram生成的词频表以及词云图。

 

“GE千亿美元大数据转型”词频图-IT经理网(CTOCIO.com) | Create infographics

 

“GE千亿美元大数据转型”词频分析-IT经理网(CTOCIO.com) | Infographics

 

Many Eyes

Many Eyes是IBM的一个Web服务。 提供很多可视化的工具, 包括各种图表。 而Many Eyes最强的就是文本分析功能。

下图就是IT经理网编辑利用Many Eye上的数据例子对马丁路德金牧师的“我有一个梦”进行文本分析产生的词云图(Many Eyes 还不支持中文分词)。

clip_image012

此外, Many Eyes的文本分析还能显示词组的关联, 让你知道作者常用的词组关联是哪些。

 

clip_image014

比如 “我有一个梦”的演讲里Freedom出现的频次最多。 我们还可以建一个单词树, 来专门看从Freedom延伸下去的词。

clip_image016

Statwing

Statwing 是一个非常简单的教会用户使用统计图表的应用。 你只需要上传数据, 把你需要关注的变量打上勾, Statwing就可以把统计关系图画出来。 而且可以把各个变量的样本大小, 最大最小值, 平均数, 中位数以及标准方差等一系列统计指标列出来。

下图是Derrick Harris上传的自己的Fitbit的数据。 试图研究一下自己的每天活动和卡路里消耗量的关系。

clip_image018

Tableau Public

Tableau Public 是Tableau的免费版本。 它需要一些结构化的数据, 也需要你懂一些BI。 不过类似于拖拽这样的功能, 对于那些想试试的用户来说, 还是比较方便的。

下图是IT经理网编辑根据data.gov上最近7天的地震数据用Tableau生成的可视化的图。 读者也可以试一试, 数据在这里

clip_image020

总结:

这些数据分析及可视化的工具,可以很简单地帮助用户实现一些看起来很难的分析或者可视化。 对于那些想试着上手的用户来说, 是一个接触数据分析和可视化的捷径。 不过, 需要注意的是,很多工具需要的是结构化的数据,比如列作为变量, 行做为样本。因此,在使用这些工具之前, 需要对数据进行清洗, 把数据整理成为可用的格式才可以使用。

 

猜你喜欢

转载自blog.csdn.net/xin_rong/article/details/81479168