商业智能的介绍

商业智能的介绍

前言

本来是写商业智能数据分析。但是写着写着,商业智能的部分占了很大一部分就干脆作为单独的一篇。

商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具

简而言之,帮企业做决策的工具。是传统行业报告的进阶。这个商业智能更加科学和全面,可以分析出许多信息,帮助决策者分析。并且还具有实时性。

使用到的技术

说得天花乱坠,那么商业智能是啥?

从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。

  • 数据仓库(Data Warehouse)和数据集市(Data Mart)产品。包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型。
  • 当今的数据处理大致可以分成两大类:联机事务处理OLTP(On-Line Transaction Processing)、联机分析处理OLAP(On-Line Analytical Processing)。
  • OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
  • OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
  • 数据挖掘(Data Mining)软件。使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。
  • 数据仓库就是将报表存入数据库中,用的技术栈是SQL、spark;
  • 在线分析处理就是把数据呈现处理,用的技术栈是后端技术栈、前端技术栈;
  • 数据挖掘就是找数据间的关系,用的技术栈是Python(人工智能的库)。

实施商业智能系统是一项复杂的系统工程。大致实施步骤为:

需求分析:收集企业需求,想通过什么数据得出什么结论;

数据仓库建模:对企业需求分析,建立企业数据仓库的逻辑模型和物理模型;

数据抽取:将数据从业务系统抽取到数据仓库。在抽取过程必须对数据进行转换、清洗,以适应分析的需要;

建立商业智能分析报表:就是数据可视化

用户培训和数据模拟测试:给用户使用;

系统改进和完善:迭代升级

这个就是软件工程中的可行性研究、需求分析、设计、编码、测试、集成和维护。感觉好有意思。大学里教的东西真的就像内功,万金油,哪都能用。

商业智能的发展现状

经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、OA等基础信息化系统。

这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为OLTP(Online Transaction Process,在线事务处理),指的就是系统运行了一段时间以后,必然帮助企事业单位收集大量的历史数据。

但是,在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。业务人员所需要的是信息,是他们能够看懂、理解并从中受益的抽象信息。此时,如何把数据转化为信息,使得业务人员(包括管理者)能够充分掌握、利用这些信息,并且辅助决策,就是商业智能主要解决的问题。

如何把数据库中存在的数据转变为业务人员需要的信息?大部分的答案是报表系统

报表系统已经可以称作是BI了,它是BI的低端实现。

国外的企业,大部分已经进入了中端BI,叫做数据分析。有一些企业已经开始进入高端BI,叫做数据挖掘。而中国的企业,大部分还停留在报表阶段。

根据微观经济学的理论。经济学研究的对象包含资源稀缺性和选择这两个主要方面。资源稀缺性就不赘言了。每个经济个体进行经济活动的时候就需要做出选择。

在古代的时候,商人通常是根据账单和市场信息来进行选择;到了现代也同样如此。

  • 在计算机时代,商人通过电子表如Excel统计账单和行业报告,然后处理账单和分析行业报告,最后让决策者决策;
  • 到互联网时代,商人通过网上的OA平台进行表单的收集和处理,最后让决策者决策(外部的靠人脉和行业报告)。
  • 大数据时代,商人通过数据挖掘(用人工智能分析数据,找数据的相关性)的信息结合报表统计信息和行业报告来做出决策。

说到底就是一个处理报表的系统平台。

这上面那段文字所说的初级BI、中级BI、高级BI。在我看来就是在线事务网站、在线分析网站、数据挖掘网站;

用到的技术栈分别是

  • 初级BI(在线事务网站):后端、数据库。将线下报表的事移植到线上。LAMP的架构可以满足。
  • 中级BI(在线分析网站):增加前端。将数据进行可视化展示。需要用几个可视化库,如echarts、mapbox;
  • 高级BI(数据挖掘):用Python使用人工智能库实现(如Numpy、paddlepaddle)。可以分析各个数据之间的相关性,挖掘表层分析不到的内容。

明白这些定位后,也好知道自己怎么准备技术栈。

结语

顺了一遍商业智能中自己不清楚,概念模糊的部分。

之前一直迷迷糊糊。感觉好像是,又好像不是。什么数据模型、数据挖掘、人工智能、用户画像、用户行为分析。五花八门。找不到一个参照物。现在捋了一下,好多了。

  • 如果我做数据可视化,那么就属于数据分析的范畴。
  • 如果我用人工智能去分析各个数据之间的相关性,那么就是数据挖掘范畴。

数据挖掘属于数据分析,但是高于数据分析。

其实在我看来只有用到人工智能的才算商业智能。没用人工智能的顶多算是大数据分析(商业分析)。

商业分析其实自古以来都是一模一样的。

  • 古代用纸记账,然后通过账房先生算账,老板根据哪些商品,人买的多就多进一些货。
  • 现代在Excel上记账,然后用Excel做成表格,老板看这些表格,决定决策。
  • 再后来就是实现线上记账,后端处理这些数据,前端程序这些数据,老板看这些数据做决策。

直到人工智能的成熟,让两个完全不相关的东西都能联系起来,提供除统计外的信息,能帮助老板做更多的分析。

看到这里,我发觉自己大概就停留在商业分析这了。我现在大部分技术栈都是弄商业分析的。人工智能那块没涉及。以后学到商业分析的天花板的时候再涉足数据挖掘。

不过商业分析也不简单。商业分析来的数据占了绝大多数的信息。也是行业报告的主要信息。我以后做好商业分析就不错了。

我目前已经舍弃了两个方向的深入,一个是后端,一个是数据挖掘。目前暂保留的两个方向,一个是数据库,一个是前端可视化。(我感觉慢慢全栈了,但全栈要学得东西太多了,很容易学得七上八下,干啥啥不行)

更新地址:GitHub

更多内容请关注:CSDNGitHub掘金

猜你喜欢

转载自blog.csdn.net/weixin_42875245/article/details/108684925