越来越多的业务,越来越多的信息化系统,让很多公司拥有了海量数据,但是分散的数据、隔离的系统,又形成了一个个数据孤岛。于是,为了利用好数据,各大公司纷纷建设了数据仓库,或者是最近升级为大数据平台之类的,但是,不同条线不同场景的数据又要如何整合到同一个仓库呢?
数据模型就此应运而生,通过高度抽象的数据模型,整合各个源系统的数据,最终形成统一、规范、易用的数据仓库,进而提供包括数据集市、数据挖掘、报表展示、即席查询等上层服务。数据模型能够促进业务与技术进行有效沟通,形成对主要业务定义和术语的统一认识,具有跨部门、中性的特征,可以表达和涵盖所有的业务。无论是操作型数据库,还是数据仓库都需要数据模型组织数据构成,指导数据表设计。或许Linux的创始人Torvalds说的一句话——“烂程序员关心的是代码,好程序员关心的是数据结构和他们之间的关系”最能够说明数据模型的重要性。只有数据模型将数据有序的组织和存储起来之后,大数据才能得到高性能、低成本、高效率、高质量的使用。数据建模是通过定义和分析数据需求,以支持信息系统内的业务流程。
以上看来,数据建模至关重要。数据建模过程需要专业的建模人员,业务人员以及潜在信息系统的用户紧密工作在一起。数据建模是认识数据的过程,数据模型是数据建模的输出模型有很多种,例如企业数据模型,物理模型,逻辑模型,业务模型,数据使用模型等等。在数据模型中既描述了业务关系,又描述了物理数据库的设计,是企业数据资产的核心。通过数据模型管理可以清楚地表达企业内部各种业务主体之间的相关性,使不同部门的业务人员、应用开发人员和系统管理人员获得关于系统的统一完整的视图
我们需要使用专业的软件来帮助我们建立数据逻辑模型和物理模型、生成DDL,并且能够生成报告来描述这个模型,同时分享给其他伙伴。本文列出的工具都是精挑细选的数据建模工具。
PowerDesigner
PowerDesigner是目前数据建模业界的领头羊。功能包括:完整的集成模型,和面向包含IT为中心的、非IT为中心的差异化建模诉求。支持非常强大的元数据信息库和各种不同格式的输出。PowerDesigner拥有一个优雅且人性化的界面,非常易懂的帮助文档,快速帮助用户解决专业问题。
CA ERwin
ERwin 也是业界领先的数据建模解决方案,能够为用户提供一个简单而优雅的界面同时处理复杂的数据环境问题。Erwin的解决方案提提供敏捷模型,同时元数据可以放在普通的数据库中进行处理,这样就能够保证数据的一致性和安全性。Erwin支持高度自定义的数据类型、APIs,允许自动执行宏语言等等。Erwin还建有一个很活跃的用户讨论社区,使得用户之间可以分享知识和各种经验。
Datablau(数语科技) DDM
国内商业版数据建模工具.由前Erwin全球研发团队打造。性价比高,所需建模功能齐全;支持完整的二次开发API,对接内部系统;且同样具备浮动许可证的服务。支持对关系型、NoSQL、ERP数据源的数据模型自动抽取。可视化ER图的方式设计数据库。支持应用数据标准到数据库设计。支持多人协作的数据建模跨部门共享数据模型。支持周期性监控实际数据库与数据模型的一致性,管理数据库中文界面全新设计,更适合国内企业现状和使用习惯。
三款产品比对
|
Datablau – DDM |
SAP -PowerDesigner |
Erwin.Inc |
逻辑模型 |
支持 |
支持 |
支持 |
RDBMS |
支持 |
支持 |
支持 |
NewSQL |
原生支持 |
不支持 |
非原生支持,通过第三方桥接器 |
图形展示 |
支持 |
支持 |
支持 |
中文 |
支持中/英文 |
不支持中文 |
不支持中文 |
逆向工程 |
支持 |
支持 |
支持 |
正向工程 |
支持 |
支持 |
支持 |
数据标准 |
独有 |
不支持 |
不支持 |
命名标准 |
自动翻译,独有 |
支持 |
支持 |
数据规范 |
支持且可配置 |
不支持 |
不支持 |
协作 |
支持模型库,模型版本/签入签出/分支/模型比较 |
支持模型库与递增版本 |
支持模型库与递增版本 |
云平台 |
支持阿里云和AWS |
不支持 |
不支持 |
Web模型 |
支持Web模型质量报告 |
仅浏览ER图 |
仅浏览ER图 |
元数据打通,监控模型基线与生产库一致性 |
支持 |
不支持 |
不支持 |
主动式模型变更影响及血缘分析 |
支持 |
不支持 |
不支持 |
数据智能关系发现 |
支持 |
不支持 |
不支持 |
上推数据标准 |
支持 |
不支持 |
不支持 |
模型质量报告和评估 |
支持 |
不支持 |
不支持 |
支持国产数据库(MaxCompute, 星环,Gbase等) |
支持 |
不支持 |
不支持 |