初始GaussDB
名字的由来:GaussDB是华为数据库产品品牌名,致敬数据加高斯(Gauss)
GaussDB的版本
- GaussDB 100:目前暂不发布,公司合作伙伴需向华为提交申请
- GaussDB 200:目前官方可下载
- GaussDB 300:无
GaussDB版本的区别
- GaussDB T(OLTP):前身是GauussDB 100,主打OLTP在线事务处理。用于存储/查询业务应用中活动的数据以支撑日常的业务活动。对标Oracle及其他关系型数据库。现已运用在招商银行(掌上生活)。
- GaussDB A(OLAP):前身是GaussDB 200,主打OLAP在线分析处理,用于存储历史数据以支撑复杂的分析操作,侧重决策支持。对标Teradata及其他分布式数据库,目前在工商银行得到上线应用。
OLTP和OLAP比较
数据处理类型 | OLTP | OLAP |
---|---|---|
分析粒度 | 细节的 | 细节的,综合的,或提炼的 |
时效性 | 在存取瞬间是准确的 | 代表过去的数据 |
可更新性 | 可更新 | 不更新 |
操作可预知性 | 操作需求事先可知道 | 操作需求事先可能不知道 |
实时性 | 对性能要求高,相应毫秒级别、秒级 | 对性能要求相对宽松,相应分钟级、小时级 |
数据量 | 一个时刻操作一条或几条记录,数据量小 | 一个时刻操作一集合,数据量大 |
驱动方式 | 事务驱动 | 分析驱动 |
应用类型 | 面向应用 | 面向分析 |
应用场景 | 支持日常运营 | 支持管理需求 |
典型应用 | 银行核心系统、信用卡系统 | ACRM、风险管理 |
GaussDB T介绍
GaussDB T是一款全透明分布式数据库,支持x86和Kunpeng硬件架构,基于创新性数据库内核,提供高并发事务实时处理能力、两地三中心金融级高可用能力和分布式高扩展能力,用于支撑金融、政府、电信等行业核心关键系统。
**特点:**高性能、安全可靠、易开发、易运维。
发展史:
GaussDB T 数据库从2002年开始研发,基于全自研内核,自主可控。
部署形态:
GaussDB T 支持多种部署方式,支持单机、主备 和 分布式部署,支持x86和鲲鹏的硬件
概念补充:
- 实例:zengine进程及其所管理内存结构。实例用于控制和管理数据库,是数据库提供服务的媒介。Gauss100为多线程架构,实例只包含一个进程——zengine。
- 数据库:控制文件、日志文件、数据文件等物理文件的集合。
- 实例和数据库的关系:实例加载数据库,并对外提供服务;数据库通过实例与外界交互,达到存取数据的目的。一个实例,最多只能加载一个数据库。
GaussDB A 介绍
GaussDB 200是企业级的大规模并行处理关系型数据库。其采用MPP(Massive Parallel Processing)架构,支持行存储与列存储,提供PB(Petabyte,2的50次方字节)级别数据量的处理能力。
应用场景:
订单查询、数据仓库、混合负载、大数据分析
技术特点:
低成本、高性能、高可靠、支持海量数据
GaussDB 200部署形态:
GaussDB 200整个系统网络划分为2个平面,即业务平面和管理平面。两个平面之间采用物理隔离的方式进行部署,保证业务、管理各自网络的安全性。
- 管理平面:通过运维网络接入,提供系统管理和维护功能,主要用于集群的管理,对外提供集群监控、配置、审计、用户管理等服务。
- 业务平面:主要用于集群内部数据处理的专用网络平面,此处的业务平面非客户的应用网络平面。
组网方案节点如下:
节点类型 | 说明 |
---|---|
管理节点 | Management Node(MN),是GaussDB 200集群的管理系统,提供统一的访问入口。FusionInsight Manager对部署在集群中的节点及服务进行集中管理。主要部署OMSServer。 |
控制节点 | Control Node(CN),控制节点控制监控数据节点,并执行对集群接入用户的认证鉴权,存放认证鉴权数据。GaussDB 200的控制节点主要部署KrbServer、LdapServer等。 |
数据节点 | Data Node(DN),执行管理节点发出的指示,上报任务状态、存储数据,以及执行数据节点的公共功能。GaussDB 200的数据节点主要部署MPPDBServer。 |
MPP架构介绍
MPP即大规模并行处理(Massively Parallel Processing )。 在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。
优势:
- 计算靠近数据,避免了大量的数据搬迁,可以获得更高的性能。
- 无共享架构相比共享存储的架构,具备更好的扩展性。
架构组件介绍
-
CN(Coordinator Node):协调节点,负责接收来自应用的访问请求,并向客户端返回执行结果;负责分解任务,并调度任务分片在各DN上并行执行。(分布式业务接入,数据访问路由)
-
DN(Database Node):数据节点,数据库核心组件,提供数据查询和数据存储能力。
-
CM(Cluster Manager):集群管理,负责集群内高可用。管理和监控分布式系统中各个功能单元和物理资源运行情况,确保整个系统稳定运行。
-
OM(Operation Manager):运维管理,工具和命令集,提供日常运维、备份、配置、监控等管理结构和工具链
-
DM(Database Manger):图形化运维入口(图中未画出),提供丰富的图形化运维管理功能
-
DT(Developer Tools):开发工具,Data Studio(DS)SQL图形化开发工具;
数据迁移工具,提供离线、在线等多种数据迁移方案。 -
GTS(Global Time Service):全局闹钟服务。 用于强一致场景下,为各个节点提供逻辑时钟。
-
GTM:全局事务控制器,负责生成和维护全局事务ID、事物快照、时间戳等需要全局唯一的信息。
-
WLM:工作负责管理器,控制系统资源的分配,防止过量业务负载对系统的冲击而导致业务拥塞和系统崩溃。