1 Greenplum整体架构信息 - 代码天地

1 Greenplum整体架构信息

其他 2019-01-14 12:27:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/xfg0218/article/details/86472908

1.1 架构图示

在以上的架构中可以看出Greenplum主要是由Master和Segment组成的，Master承担生成查询计划并派发汇总执行结果，Segment是执行查询计划及数据储存管理。集群可以直接加载外部的数据。

官网请查看:https://greenplum.org/

Greenplum官方文档:https://gp-docs-cn.github.io/docs/common/gpdb-features.html

1.2 Master主机与Segment主机任务

Master主机负责	Segment主机负责
1. 建立与客户端的会话连接和管理	1. 业务数据的存储和存取
2.sql的解析并形成分布式的执行计划	2.执行由master分发的sql语句
3.将生成好的执行计划分发到每个Segment上执行	3.对于master来说，每个 Segment都是对等的，负责对应数据的存储和计算
4.收集Segment的执行结果	4.每一台机器上可以配置一到多个Segment
5.master不存储业务数据，只存储数据字典	5.由于每个Segment都是对等的，建议采用相同的机器配置
6.master主机可以一主一备, 分布在两台机器上	6.Segment分primary 和mirror两种, 一般交错第存放在子节点上
7.为了提高性能，master最好单独占用一台机器

1.3 数据库分布键分布数据策略

由于greenplum数据库是个分布式数据库,数据分布在每一个segment节点上，其中数据的分布策略有两种分别是hash分布于随机分布。

1.3.1 HASH策略

Hash分布是利用Distributed by (filed1,filed2....) 做为数据分布的条件，计算hash值,并通过hash值路由到制定的segment上,如果不指定分布键,默认的是获取第一个字段作为分布键。在字段作为分布键时，该字段的值尽量是唯一的，这样才能分布的均匀，效率会更高，否则会降低数据库的想能。

1.3.2 随机分布

随机分布也叫平均分布。数据会随机的落在每一个segment节点上,不管数据内容是什么格式都会落到segment上，在SQL查询数据,数据会重新分布，性能会比较差，随机分布的用法为Distributed randomly;

1.4 master主节点获取segment节点上的数据顺序

Master在执行sql语句时由于数据切分放在每个segment上,master获取结果的顺序是segment提交的顺序，segment提交到master的顺序是随机的,就会导致一样的数据每次的查询结果顺序不一致，这也是与其他的数据不一样的地方。

猜你喜欢

转载自blog.csdn.net/xfg0218/article/details/86472908

1 Greenplum整体架构信息

Greenplum学习实践-【安装部署】-1、部署整体设计

Greenplum数据库整体架构

jQuery源码学习（1）- 整体架构

GeoMesa源码学习 (1)：整体架构

比特币代码分析1 整体架构

Linux电源管理(1)_整体架构

jquery源码学习-1-整体架构

Tomcat源码分析(1)-Tomcat整体架构

SQL Server整体架构（1）——实例

2-1-1 tomcat整体架构及组件介绍

Greenplum学习1--greenplum安装1

Spark源码分析1-部署与整体架构

第1章 Spring整体架构和环境搭建

muduo库的源代码分析1--整体架构

spring源码解析1--spring整体架构

模型机CPU设计——设计的整体架构（1）

Hyperledger Fabric(1) - 整体架构和源码结构

Greenplum 架构

kafka整体概念1

OpenStack整体理解(1)

nmap整体流程1

LNMP架构详解（1）——了解架构的基本信息

架构1

1论信息系统项目整体管理论文

jQuery 事件机制源代码分析1——jQuery事件机制整体架构

【 Ecology9 】- 1 E9后端整体架构说明

kubernetes二进宫系列——k8s整体架构与核心组件详解-1

大数据课程L1——网站流量项目的概述&&整体架构

layui实现整体排序1

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)