PostgreSQL的架构

是最先进的数据库。他的第一个版本在1989年发布，从那时开始，他得到了很多扩展。根据db-enginers上的排名情况，PostgreSQL目前在数据库领域排名第四。

本篇博客，我们来讨论一下PostgreSQL的内部架构，以及各个组件之间如何交互。这将是本期PostgreSQL DBA系列博客的基石。

一、PostgreSQL的架构

PostgreSQL的物理架构非常简单，它由共享内存、一系列后台进程和数据文件组成。 (如下图)

二、Shared Memory

共享内存是服务器服务器为数据库缓存和事务日志缓存预留的内存缓存空间。其中最重要的组成部分是Shared Buffer和WAL Buffer。

Shared Buffer

Shared Buffer的目的是减少磁盘IO。为了达到这个目的，必须满足以下规则：

当需要快速访问非常大的缓存时（10G、100G等）
如果有很多用户同时使用缓存，需要将内容尽量缩小
频繁访问的磁盘块必须长期放在缓存中

WAL Buffer

WAL Buffer是用来临时存储数据库变化的缓存区域。存储在WAL Buffer中的内容会根据提前定义好的时间点参数要求写入到磁盘的WAL文件中。在备份和恢复的场景下，WAL Buffer和WAL文件是极其重要的。

三、PostgreSQL 进程类型

PostgreSQL有四种进程类型

Postmaster (Daemon) Process（主后台驻留进程）
Background Process（后台进程）
Backend Process（后端进程）
Client Process（客户端进程）

Postmaster Process

主后台驻留进程是PostgreSQL启动时第一个启动的进程。启动时，他会执行恢复、初始化共享内存爱你的运行后台进程操作。正常服役期间，当有客户端发起链接请求时，它还负责创建后端进程。

如果通过pstree命令查看进程之间的关系，你会发现Postmaster进程是其他所有进程的父进程。

Background Process

PostgreSQL操作需要的后台进程列表如下：

进程	作用
logger	将错误信息写到log日志中
checkpointer	当检查点出现时，将脏内存块写到数据文件
writer	周期性的将脏内存块写入文件
wal writer	将WAL缓存写入WAL文件
Autovacuum launcher	当自动vacuum被启用时，用来派生autovacuum工作进程。autovacuum进程的作用是在需要时自动对膨胀表执行vacuum操作。
archiver	在归档模式下时，复制WAL文件到特定的路径下。
stats collector	用来收集数据库统计信息，例如会话执行信息统计（使用pg_stat_activity视图）和表使用信息统计（pg_stat_all_tables视图）

Backend Process

最大后台链接数通过max_connections参数设定，默认值为100。后端进程用于处理前端用户请求并返回结果。查询运行时需要一些内存结构，就是所谓的本地内存（local memory）。本地内存涉及的主要参数有：

work_mem：用于排序、位图索引、哈希链接和合并链接操作。默认值为4MB。
maintenance_work_mem：用于vacuum和创建索引操作。默认值为64MB。
temp_buffers：用于临时表。默认值为8MB。

Client Process

客户端进程需要和后端进程配合使用，处理每一个客户链接。通常情况下，Postmaster进程会派生一个紫禁城用来处理用户链接。

四、数据库结构

想要理解PostgreSQL的数据库结构，需要先了解一些重要的概念。

数据库相关概念：

PostgreSQL由一系列数据库组成。一套PostgreSQL程序称之为一个数据库群集。
当initdb()命令执行后，template0 , template1 , 和postgres数据库被创建。
template0和template1数据库是创建用户数据库时使用的模版数据库，他们包含系统元数据表。
initdb()刚完成后，template0和template1数据库中的表是一样的。但是template1数据库可以根据用户需要创建对象。
用户数据库是通过克隆template1数据库来创建的；

表空间相关概念：

initdb()后马上创建pg_default和pg_global表空间。
建表时如果没有指定特定的表空间，表默认被存在pg_default表空间中。
用于管理整个数据库集群的表默认被存储在pg_global表空间中。
pg_default表空间的物理位置为$PGDATA\base目录。
pg_global表空间的物理位置为$PGDATA\global目录。
一个表空间可以被多个数据库同时使用。此时，每一个数据库都会在表空间路径下创建为一个新的子路径。
创建一个用户表空间会在$PGDATA\pg_tblspc目录下面创建一个软连接，连接到表空间制定的目录位置。

表相关概念：

每个表有三个数据文件。
一个文件用于存储数据，文件名是表的OID。
一个文件用于管理表的空闲空间，文件名是OID_fsm。
一个文件用于管理表的块是否可见，文件名是OID_vm。
索引没有_vm文件，只有OID和OID_fsm两个文件

其他需要注意的地方

表和索引创建时文件名是OID，此时的OID和pg_class.relfilenode的值是一样的。不管怎样，当我们执行重写操作时（truncate，cluster，vacuum full，reindex等），被修改对象的relfilenode值也会被修改，文件名也会随着reffilenode值一起改变。我们可以通过pg_relation_filepath('<object_name>')视图很容易的检查文件位置和名称。