数据管理模型的作用

数据管理模型的作用
探讨数据管理就离不开数据管理模型,可以说对于从事数据管理工作的人来说,无论他是甲方还是服务方,数据模型一直是数据管理工作的焦点,也是难点。也可以说有多少个数据管理系统就有多少个数据管理模型。虽然说国外有一些标准化组织提供了一些石油数据管理模型,但是真正完全按照这些模型建立的数据管理系统非常少,很多号称遵循某些标准的数据模型也是半遮半掩,掺杂了很多自己的认识和“特殊情况”。国内各个油公司及各个油田在数据管理模型方面就更加丰富多彩,并且都是各有特色。
当然每一个数据管理模型都是项目实施人员的智慧结晶,都有其合理性和科学性,站在纯技术的角度去考虑,很多时候无法判断一个数据管理模型的优劣,很多的数据管理模型问题都是在数据应用阶段才逐步暴露出来,但是到这个时候,很多事情已经有点晚了。
从包含的数据范围看,模型有大有小,最大的莫过于这些年各个油公司实行的石油勘探开发数据一体化管理项目,在这些项目中,都希望建立一个覆盖石油勘探开发所有数据的模型,能够把我们生产、研究、管理活动中所有的数据都可以放在这个巨大的模型中,由总部统一管理统一维护。撇开一个具体数据管理模型的好坏,站在数据管理模型基本概念上讲,一个合理的数据管理模型还是需要遵循一些基本原则,满足一些基本要求的。
如果简单地想,数据管理模型其实就是存放或者管理一类业务数据的全部信息的一种结构模型。无论一个模型包含的数据范围有多少,衡量一个模型好坏一个简单的标准就是看模型是否将数据全部应该有的信息包含进去了。在“石油数据的本质”这篇文章中,我们提到过,一个数据的完整描述应该包含数据的七个方面的要素(对象、属性维度、数据表现形式维度、数据产生维度信息、数据评论维度、数据使用维度信息、数据管理维度信息)、加上数据关系、数据源头信息等九个方面,一个好的模型应该是将这些要素尽可能多地涵盖进去,这是基本的要求。具体说有以下几个方面的要求:
1) 把所有的数据信息存放进去
所有的数据信息实际上就是数据的七个描述维度信息加上数据关系、数据源头信息,一个好的数据管理模型应该能够将这些信息全部放进去。在这几个方面信息中,如果从宏观上划分,基本上可以分为两大类,一是数据本身的基本信息,主要是对象、属性维度信息等内容,二是数据体之外的其它信息,可以统称为元数据信息。目前大部分数据管理模型只是将第一部分信息放进去了,对于元数据信息只有很少内容在数据管理模型中体现。
由于石油勘探开发认识的高度不确定性特征,在数据使用过程中,元数据信息比数据本身信息更为重要,可以说,缺少元数据信息的石油勘探开发数据基本上是无用的数据。所以站在应用的角度,在数据管理模型中包含元数据信息非常必要。
2) 保留数据之间的专业逻辑关系
石油勘探开发数据的主体是描述地下地质体的各个方面属性信息,不同的数据之间在设计之初就赋予了很强的专业逻辑关系,这种逻辑关系在数据的使用过程中起到非常大的作用。特别是地下地质体都是通过间接信息描述的,需要将各个维度的数据组合起来解释,这就对数据之间的关系管理提出更高的要求。
数据之间的专业逻辑关系很难直接管理,也无法去直接识别,更不可能通过自动或者手工去建立两两之间数据的逻辑关系。由于石油勘探开发数据是主动产生数据,其关系在设计数据之初都已经建立了,数据管理模型中只需要按照专业设计的思路通过数据目标、属性维度等之间的关系记录和管理就可以完整对数据之间的关系进行管理。
3) 能够覆盖整个业务
数据都是在业务中产生的,也是描述和记录业务过程和业务结果的,好的数据管理模型应该能够覆盖整个业务过程,将业务过程中产生的所有数据记录下来。为了能够实现这个目的,过去十几年各个石油公司实施了很多大型的数据管理项目,试图将勘探开发所有的数据都存放在某些大型的数据管理模型中,最终结果看总有部分数据不能在模型中存放和管理。主要原因是站在业务的角度,数据有多种维度,如动态数据、静态数据;现场采集数据、研究成果数据;总部数据、分公司数据、基层单位数据;不同业务线数据,如勘探数据、开发数据、油藏数据、生产数据等。一个简单的模型很难将不同维度的数据包含起来。
4) 能够按照一个模式简单扩展
石油勘探开发技术是在不断发展的,一个新的技术应用都会产生一批新的数据,人们肯定希望后期产生的数据能够马上融入到过去的数据管理体系中,这就要求设计的数据管理模型是容易扩展的,并且能够按照统一的模式扩展以适应未来不可知的各种需求。
5) 能够被数据应用人员理解和应用
数据管理的最终目的是应用,并且是专业人员应用,对于专业人员来讲,他们应用数据是按照专业的习惯去想,去提出需求,如我想要XX井位的数据,他实际上是想看井位测量数据,也想看井位图,同时可能还想看当初的井位设计报告等。另外在研究的过程中,需要得到“过去五年内关于这个地区储层研究的有关成果和基础资料”,当他们提这些需求时完全是专业的逻辑和思路,他们并不知道也不关心这些数据以什么结构存放,以及存放在什么地方。数据管理模型要能够识别这些业务含义,并且能够按照业务含义找到对应的数据。
6) 数据管理模型的设计思路
从数据全生命周期角度,包括数据的存储、管理和应用三方面功能,我们设计的数据管理模型理论上要满足这三方面的需求。目前常规模式是希望用一个数据管理模型将数据的存储、管理及应用全部统一起来,从理论上这是合理的,但是由于数据的存储、管理及应用涉及到完全不同的技术要求,用一个统一的模型去满足三方面的需求几乎是不可能的事情,这些年各个石油公司花费巨资建立的各种统一数据管理系统很难在实际应用中发挥作用也是证明。
我们参考一下商业互联网的发展思路,过去传统的商场都是自己存储货物、自己管理货物、自己提供面对客户的直接销售,和我们现在数据管理的思路一样,也是存储、管理和服务一体的。淘宝、京东采用了新的管理模式,颠覆了传统商业模式,其本质上就是将商品的存储、管理和服务分离,商品的存储交给商户(自己也做一部分),管理采用虚拟的管理界面,将所有的商品统一编目管理,并且增加了大量用户关心的商品信息和用户使用信息,服务交给独立的快递系统。通过分离的模式不仅可以将所有的商品放在系统上(理论上),还可以提供统一一致的管理方式和更加灵活的统一的服务方式。
我们近两年借用商业互联网思路,设计了OiO数据中台,其本质就是将石油数据存储、管理和服务分离,重点设计了数据的统一管理模型及实现技术,实现了对所有石油数据的统一管理和服务(如下图)。数据管理模型的作用

猜你喜欢

转载自blog.51cto.com/15069843/2642156