postgresql standby启动流程分析

 


目录

前言

概述

原理机制

关键流程

备节点启动

walreceiver启动的时机

结尾


前言

本文是基于postgresql 15的代码进行分析解读,演示是在centos8系统上进行。


概述

hot-standby模式是postgresql提供的一种高可用方案,可以通过一主一备,或一主多备,以及一主多级级联备来达到数据和业务的高可用,备节点也可以进行只读业务,所以对只读业务的性能也会有很好的提升。

通过hot-standby模式也可以搭建容灾部署,达到多地多中心的效果。

原理机制

先来看下hot-standby如何搭建,要经过以下步骤:

(1)当然主节点要设置wal_level,pg_hba中设置访问权限,walsender要和备节点数量有关;

(2)通过pg_basebackup备份主节点的当前数据,此份数据就可以作为备节点启动,参数控制单独生成wal还是放在数据目录,带有-R时还会生成recovery信息;

(3)备节点设置standby=on,同时设置主节点的连接访问信息;这个可以在pg_basebackup时通过参数一次性搞定;

(4)启动备节点,此时主节点修改的数据就在备节点上看到。

那么,这是如何实现的呢?

我们通过以下原理介绍来回答这些问题。

我们查看主备后台进程,会发现几个平常看不到的进程信息

[senllang@localhost cbase]$ ps -ef|grep postgres

senllang   1440923       1  0 Apr23 ?        00:00:00 /opt/postgres/bin/postgres -D pgtest -p 8889

senllang   1440924 1440923  0 Apr23 ?        00:00:10 postgres: checkpointer

senllang   1440925 1440923  0 Apr23 ?        00:00:28 postgres: background writer

senllang   1441187 1440923  0 Apr23 ?        00:00:05 postgres: walwriter

senllang   1441188 1440923  0 Apr23 ?        00:00:00 postgres: autovacuum launcher

senllang   1441189 1440923  0 Apr23 ?        00:00:00 postgres: logical replication launcher

senllang   1441398       1  0 Apr23 ?        00:00:00 /opt/postgres/bin/postgres -D standby  -p 8888

senllang   1441399 1441398  0 Apr23 ?        00:00:16 postgres: checkpointer

senllang   1441400 1441398  0 Apr23 ?        00:00:21 postgres: background writer

senllang   1441401 1441398  0 Apr23 ?        00:06:38 postgres: startup recovering 00000002000000060000001C

senllang   1531801 3811240  0 Apr24 pts/3    00:00:00 /opt/postgres/bin/psql -d postgres -p 8889 -h 127.0.0.1

senllang   1531920 1441398  0 Apr24 ?        00:00:02 postgres: walreceiver streaming 6/1C48E758

senllang   1531922 1440923  0 Apr24 ?        00:00:01 postgres: walsender senllang 127.0.0.1(49266) streaming 6/1C48E758

主节点的端口为8889,对应的postmaster进程号为1440923  ,主节点下多了一个walsender 进程;

备节点的端口号为8888,对应的postmaster进程号为1441398  ,备节点下有两个进程startup ,walreceiver 显示在处理wal;

大家此时可以猜到主节点的变化是通过walsender发送到备节点的walreiver,然后由startup进程进行recovering,也就是redo,这样就可以在备节点看到和主节点一样的变化了。

主要流程如下图所示:

关键流程

  • 备节点启动

standby模式启动的条件,

首先看standby.signal;

其次检查数据备份状态,有两种情况下认为是可以的;

1、有label文件的话就可以启用;

2、如果有recovery.signal,同时control文件中,数据有备份状态或者是正常停止状态的就可以启用;

  • walreceiver启动的时机

walreceiver是备节点在以standby启动后,从WAL源读取WAL时,首次会给postmaster发信号启动receiver。

walreceive进程启动详细流程:

(1)在启动时调用流程

如果是备节点启动,在startup中会请求启动walreceiver,调用关系为

StartupXLOG

->PerformWalRecovery

->ReadRecord

->XLogPrefetcherReadRecord

->lrq_complete_lsn

->lrq_prefetch

->XLogPrefetcherNextBlock

->XLogReadAhead

->XLogDecodeNextRecord

->ReadPageInternal

->XLogPageRead

->WaitForWALToBecomeAvailable

在WaitForWALToBecomeAvailable会选择恢复的来源,当恢复来源为XLOG_FROM_STREAM时,会检查walreceive以及主节点的连接信息,然后向postmaster发送启动walreceive的信号。

lrq_*提供了一组函数处理LsnReadQueue,在读取WAL完成WAL的加载获取。

(2)postmaster在信号处理时,设置启动标志,在serverloop时启动进程;


结尾

作者邮箱:[email protected]
如有错误或者疏漏欢迎指出,互相学习。

注:未经同意,不得转载!

猜你喜欢

转载自blog.csdn.net/senllang/article/details/130472036