数据分析工具那么多,其实掌握这个BI就够了!

常常有人问我,数据分析用什么工具?

其实我在很多文章里面都提到过:Excel、BI、R、Python...具体看大家的需求

非要说哪一个好,其中BI工具个人觉得“老少皆宜”。

BI工具,Business Intelligence 商业智能,这就是为了数据分析而生的,而且它诞生的起点就非常高,目标是把从业务数据到经营决策的时间缩短,如何利用数据来影响决策。

数据分析工具那么多,其实掌握这个BI就够了!

有人会说,这类图网上用Excel作的也有很多。但是不一样,Excel做表格有一套,也可以做课程表,做调查问卷,作计算器来算数。术业有专攻,BI是专攻数据分析的。

比如说FineBI,当你用FineBI的时候,你会发现他是完全按照数据分析的流程来设计的,先是数据准备,做一些基础的数据处理和模型准备;再到自助数据集,对拿到的数据进行过滤、增加计算指标、合并数据关联分析;然后数据分析挖掘,通过拖拽操作,以图表、表格的形式进行多维分析,发现有价值的出具结果;最后搭建数据驾驶舱,出数据报告。

这些是数据分析的必经之路,同时这个流程里也存在着从业者的一些痛点:

1、比如清洗数据这种重复性,低附加值的工作,可以用自助数据集来解决,里面提供了很多现成的操作,比如新增列,分组统计,过滤,排序,上下合并,左右合并等功能。且每一步都有就记录,方便回顾思考过程。

2、比如做可视化展现,用Excel之类的工具可能会花费很多时间在美化上,甚至大家经常看到一些Excel技巧类的文章,实现一些精美的图表需要花很多偏门的小技巧才能够完成。这在BI(FineBI)里面都是一键生成。

这些痛点都是BI工具能够给我们带来改变和增值的地方。

为什么推荐这个工具呢,BI工具有很多呀,Power BI、Tableau…就是这些都被推荐烂了。哈哈,开玩笑,推荐它一定是有它的独到之处——完善的数据处理方案和数据管控。

自己近一年也在公司里开发一些数据产品。发现面向个人的产品很标准,就是按照一套模子做出来,迎合大部分人的大部分需求。可面向部门/企业应用的产品,有千奇百怪种状况,比方说性能,还有复杂流程的管控,数据流转那一套,都是大家很重视的。而这样做往往就有可能走定制化的路线。

后来我们就看有哪些在这方面做得比较好的工具,就遇上了FineBI。

好了,说了那么多,FineBI究竟是一个怎样的BI工具,用几个关键词来总结,数据分析挖掘、数据处理/可视化ETL、大数据高性能、企业级数据管控。

数据分析挖掘

1、探索性分析,了解数据

数据分析不可能一开始就有思路的,拿到数据时,一般都是尝试性的分析,看一下数据的趋势,看出苗头了,比方说某一处的数据突然降低很多,分析相关的可能性是什么,逐渐一步一步地去深入分析。每一步操作图表都会响应,告诉你结果。

另外,这期间很多过程有可能是错误的,有些指标是需要再计算的。对于这些“探索性”的操作,FineBI提供增加、修改、删除历史操作功能,及时修正,每一个步骤都可以预览数据,都可以回退到之前的状态。

2、分析思维主导的可视化

大家做图表,普遍都是看数据——选择图表——分类、系列——美化。其实这背后隐含的前提是你已经了解数据了,知道用什么图表。那如果是一些数据,你毫无了解,需要深度挖掘。这时候可能用到你不知道的组合性图表,在Excel里自然而然想到用VBA,太麻烦了。如果用FineBI的话,可以解决这样的思路。

5.0的可视化分析,取消了传统图表类型的概念,取代以'形状'和形状对应的'颜色','大小','提示',‘标签’等属性;取消了'分类'、'系列'等概念,取代以'横轴'、 '纵轴'两个方向。当你分析两个数据字段的相关性时,会自动选择最合适的图表(也可手动调整)。这样的思维更符合大家拿到数据不知如何分析,先初步了解数据情况的探索式分析场景。

数据分析工具那么多,其实掌握这个BI就够了!

每种图表背后都有很强的数据分析算法,能支持百万级别的数据。

一些FineBI 5.0实现的可视化效果:

数据分析工具那么多,其实掌握这个BI就够了!

数据分析工具那么多,其实掌握这个BI就够了!

数据分析工具那么多,其实掌握这个BI就够了!

3、数据挖掘

挖掘算法自然而然用R啊,多强大多专业,不过呵呵,有一定的上手难度,还需要动背后的统计原理,自己设计模型。

一直期待有傻瓜式的数据挖掘工具,只要了解比如“聚类”,点一下就给自动的分割数据分好类。

FineBI里面目前了解到有五类自动化的挖掘算法:时间序列、聚类、分类、回归和关联规则。

也就是说,如果你想预测未来的销售额,你想智能地给用户群分类,或者你想知道短信发给哪个用户获得的反馈可能性比较大,不用写任何算法代码只需要简单的拖拖拽着就可以立马看到预测和聚类的结果。

数据分析工具那么多,其实掌握这个BI就够了!

如果算法很特殊需要自己写,那用他集成R语言做吧,一手写法,一手用FineBI出可视化报告。是可以直接在FineBI中进行R语言编译的。

数据处理

做数据分析,数据处理是最烦的,往往要占据50%~70%的时间。

有一次,从IT部那儿要来数据,分析公司产品销售明细数据分析购买用户的特征,并调整相应的销售策略。这个时候需要基于销售清单数据,计算一些相应的分析指标,如每个人的消费频次,单笔消费最大金额,最近一次消费时间间隔(也就是RFM模型)。比如我还拿到了一些行业竞争数据,还需要根据同类型产品,做关联分析和横向对比分析。我又不能把这些数据放到数据源里处理,只得另建数据源,将表合并处理。

ETL处理能力是考量一个BI工具好坏的指标之一 ,FineBI的自助数据集,提供了新增列,分组统计,过滤,排序,上下合并,左右合并等功能,可视化操作。

大数据高性能

重点之一:大数据性能

BI的数据处理性能很重要,这也是优势于Excel之类的工具的因素之一。

5.0将直接对接数据库的实时数据引擎与抽取数据的引擎整合统一为Spider计算引擎。用户可以根据数据量、实时性要求、使用频次等,自由选择实时或抽取的方式。实时数据与抽取数据方式的无缝切换,将更加灵活高效支撑前端的高性能分析。

Spider数据引擎可灵活支撑不同数据量级的分析,在数据量激增之后,可横向扩展机器节点,利用Spider引擎专为支撑海量大数据分析而生的分布式方案。

数据分析工具那么多,其实掌握这个BI就够了!

spider数据引擎可灵活支撑不同数据量级的分析,在数据量激增之后,可横向扩展机器节点,利用spider引擎专为支撑海量大数据分析而生的分布式方案。

spider引擎分布式方式,结合Hadoop大数据处理思路,以最轻量级的架构实现大数据量高性能分析。此分布式方案集成了Alluxio 、Spark、 HDFS、zookeerer等大数据组件,结合自研高性能算法,列式存储、并行内存计算、计算本地化加上高性能算法,解决大数据量分析问题与在FineBI中快速展示的问题。同时从架构上保证了计算引擎系统全年可正常使用。

优势:

(1)引擎支撑前端快速地展示分析,真正实现亿级数据,秒级展示。

(2)用户可以根据数据量、实时性要求、使用频次等,自由选择实时或抽取的方式,灵活满足实时数据分析与大数据量历史数据分析的需求。

(3)抽取数据的高性能增量更新功能,可满足多种数据更新场景,减少数据更新时间,减少数据库服务器压力。

(4)合理的引擎系统架构设计可保证全年无故障,全年可正常使用。

最打动痛点的数据管控

企业级数据分析往往有不同层级的人,管理数据的,分析数据的,看数据的。每类人又有不同的需求。

初级分析用户,他们的需求往往是Dashboard即席分析,结合可视化有主题的展示业务数据,实时监控,预警分析。

一些查看数据的用户,比如领导boss们,他们的诉求就是看报告,了解业务状况,辅助业务决策。BI要做到报告可读美观,让用户聚焦于理解仪表板要表达的数据含义。

为什么经常性的要个数据要半天,要个报告要一周,因为需求太多,流程又有问题。

数据的管理是阻碍企业数据分析推行的很大原因。科技部门担心风险,导致业务部门很简单的需求不能得到及时响应;很多数据的需求本身时效性很高,一旦过了这个数据再拿到也已经没有价值了;还有部分是数据给的不完整,脏数据很多,导致业务想进行的分析做到一半进行不下去,逐渐放弃…

FineBI 5.0提供了精准的企业级数据权限管控方案,管理员可以高效便捷的进行权限配置,放心大胆的交付给分析人员相关数据,无需担心隐私数据泄露。

(1)权限统一配置。平台统一控制权限,如业务包权限、数据表行权限、数据表列权限等,权限控制的粒度更细致,更科学。通过配置主表权限,所有关联的业务表权限也会生效。

数据分析工具那么多,其实掌握这个BI就够了!

(2)权限智能继承。分析人员所做的分析表默认继承基础数据的权限,管理员无需再担心这些数据表的权限分配,每个阅读用户自动看到自己权限范围内的数据,这有利于促进分析人员之间的分享和交流。

(3)满足不同场景。不同场景对数据权限的要求是不同的,每个用户有权将自己权限范围的数据,在有需要的情况下开放给其他用户。比如总部制作的各大区的汇总销售额,想要让每个用户都可以看到,权限继承的情况下,各大区是没有权限看到其他大区的数据的,但是总部的分析表制作用户有权不继承权限,将数据开放给各大区用户。

个人感悟

数据分析工具有很多,但能上升到帮助管控企业数据,整合、分析、分发的BI工具,FineBI值得推荐,尤其是新版FineBI 5.0,不仅是数据分析挖掘工具、数据可视化工具、更是适合多数企业复杂流程下的数据分析平台。

感兴趣的朋友可以去官网免费体验啦!

官网地址:http://www.finebi.com/?utm_source=media&utm_medium=csdn

猜你喜欢

转载自blog.csdn.net/u014514254/article/details/86288032