2021年01月12日—达梦8数据库守护读写分离集群部署流程(两节点)

达梦8数据库守护读写分离集群部署流程(两节点)



一、环境说明

主机名称 IP 用途 操作系统 PORT_NUM MAL_INST_DW_PORT MAL_PORT MAL_DW_PORT
DM_P 192.168.180.130 192.168.181.130 主库 GRP1_RWW_01 Redhat 6.9 32141 33141 61141 52141
DM_S 192.168.180.131 192.168.181.131 主库 GRP1_RWW_02 Redhat 6.9 32142 33142 61142 52142
DM_M 192.168.180.132 监视器 Redhat 6.9

PORT_NUM:数据库实例监听端口
MAL_INST_DW_PORT:实例监听守护进程 TCP 连接的端口
MAL_PORT :MAL 系统监听 TCP 连接的端口
MAL_DW_PORT :实例对应的守护进程监听 TCP 连接的端口

二、创建用户和组,创建目录(所有节点操作)

脚本如下:

groupadd -g 1001 dinstall
useradd -u 1001 -g dinstall -m -d /home/dmdba -s /bin/bash dmdba
id dmdba
passwd dmdba
mkdir -p /home/{
    
    dmdata,dmarch,dmbak,dmdbms}
chown -R dmdba:dinstall /home/{
    
    dmdata,dmarch,dmbak,dmdbms}
chmod -R 775 /home/{
    
    dmdata,dmarch,dmbak,dmdbms}

三、安装数据库软件以及初始化数据库(所有节点操作)

3.1 挂载数据镜像软件

mount -o loop /home/soft/dm8_20200907_x86_rh6_64_ent_8.1.1.126.iso /mnt/dmsoft

3.2 安装数据库软件

su - dmdba
cd /mnt/dmsoft
./DMInstall.bin -i
请以root系统用户执行命令:
/opt/DM8/script/root/root_installer.sh

3.3 初始化数据库

./dminit path=/home/dmdata  PAGE_SIZE=16 
主备库初始化之后需要open一次才算初始化完成

安装和初始化数据库可以参考以下文档
https://blog.csdn.net/beatlove123/article/details/110489366

四、配置数据守护集群

4.1 主库配置

4.1.1 配置dm.ini

INSTANCE_NAME = GRP1_RT_01 
PORT_NUM = 32141 #数据库实例监听端口 
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间 
ALTER_MODE_STATUS = 0 
#不允许手工方式修改实例模式/状态/OGUID 
ENABLE_OFFLINE_TS = 2 
#不允许备库 OFFLINE 表空间 
MAL_INI = 1 
#打开 MAL 系统
ARCH_INI = 1 
#打开归档配置 
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息

4.1.2 配置dmmal.ini

MAL_CHECK_INTERVAL = 5 
#MAL 链路检测时间间隔 
MAL_CONN_FAIL_INTERVAL = 5 
#判定 MAL 链路断开的时间 
[MAL_INST1] 
MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 
MAL_HOST = 192.168.189.130 #MAL 系统监听 TCP 连接的 IP 地址 
MAL_PORT = 61141 #MAL 系统监听 TCP 连接的端口 
MAL_INST_HOST = 192.168.179.130 #实例的对外服务 IP 地址 
MAL_INST_PORT = 32141 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 
MAL_DW_PORT = 52141 #实例本地的守护进程监听 TCP 连接的端口 
MAL_INST_DW_PORT = 33141 #实例监听守护进程 TCP 连接的端口 
[MAL_INST2] 
MAL_INST_NAME = GRP1_RT_02 
MAL_HOST = 192.168.189.131 
MAL_PORT = 61142 
MAL_INST_HOST = 192.168.179.131 
MAL_INST_PORT = 32142 
MAL_DW_PORT = 52142 
MAL_INST_DW_PORT = 33142

4.1.3 配置dmarch.ini

ARCH_WAIT_APPLY = 1
[ARCHIVE_REALTIME] 
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_02 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dm8/dmarch #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~4294967294M

4.1.4 配置dmwatcher.ini

[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 453331 #守护系统唯一 OGUID 值
INST_INI = /home/dmdba/dm8/dmdata/DAMENG/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dm8/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭

4.1.5 修改数据库状态

启动数据库到mount状态
./dmserver /home/dmdba/dm8/dmdata/DAMENG/dm.ini mount 
Disql登录
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); 
SQL>sp_set_oguid(453331); 
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0); 
SQL>alter database primary; 

4.2 备库配置

4.2.1 配置dm.ini

INSTANCE_NAME = GRP1_RWW_02 
PORT_NUM = 32142 #数据库实例监听端口 
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间 
ALTER_MODE_STATUS = 0 
#不允许手工方式修改实例模式/状态/OGUID 
ENABLE_OFFLINE_TS = 2 
#不允许备库 OFFLINE 表空间 
MAL_INI = 1 
#打开 MAL 系统
ARCH_INI = 1 
#打开归档配置 
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息

4.2.2 配置dmmal.ini

MAL_CHECK_INTERVAL = 5 
#MAL 链路检测时间间隔 
MAL_CONN_FAIL_INTERVAL = 5 
#判定 MAL 链路断开的时间 
[MAL_INST1] 
MAL_INST_NAME = GRP1_RWW_01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 
MAL_HOST = 192.168.189.130 #MAL 系统监听 TCP 连接的 IP 地址 
MAL_PORT = 61141 
#MAL 系统监听 TCP 连接的端口 
MAL_INST_HOST = 192.168.179.130 #实例的对外服务 IP 地址 
MAL_INST_PORT = 32141 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 
MAL_DW_PORT = 52141 #实例本地的守护进程监听 TCP 连接的端口 
MAL_INST_DW_PORT = 33141 #实例监听守护进程 TCP 连接的端口 
[MAL_INST2] 
MAL_INST_NAME = GRP1_RWW_02 
MAL_HOST = 192.168.189.131 
MAL_PORT = 61142 
MAL_INST_HOST = 192.168.179.131 
MAL_INST_PORT = 32142 
MAL_DW_PORT = 52142 
MAL_INST_DW_PORT = 33142

4.2.3 配置dmarch.ini

ARCH_WAIT_APPLY = 1
[ARCHIVE_REALTIME] 
ARCH_TYPE = REALTIME #即时归档类型
ARCH_DEST = GRP1_RWW_01 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dm8/dmarch #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~4294967294M

4.2.4 配置dmwatcher.ini

[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 453331 #守护系统唯一 OGUID 值
INST_INI = /home/dmdba/dm8/dmdata/DAMENG/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dm8/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭

4.2.5 修改数据库状态

启动数据库到mount状态
./dmserver /home/dmdba/dm8/dmdata/DAMENG/dm.ini mount 
Disql登录
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); 
SQL>sp_set_oguid(453331); 
SQL>alter database standby; 
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0); 

4.3 配置监视器dmmonitor.ini

MON_DW_CONFIRM = 1 #确认监视器模式
MON_LOG_PATH = /home/dmdba/dm8/dmdata/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP1]
MON_INST_OGUID = 453331 #组 GRP1 的唯一 OGUID 值 #以下配置为监视器到组 GRP1 的守护进程的连接信息,以―IP:PORT‖的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 192.168.189.130:52141
MON_DW_IP = 192.168.189.131:52142

4.4 启动监视器查看集群状态

[dmdba@RH6 bin]$ ./dmmonitor /home/dmdba/dm8/monitor/dmmonitor.ini 
[monitor]         2020-11-30 23:40:48: DMMONITOR[4.0] V8
[monitor]         2020-11-30 23:40:48: DMMONITOR[4.0] IS READY.
[monitor]         2020-11-30 23:40:48: 收到守护进程(GRP1_RWW_01)消息
                  WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
                  2020-11-30 17:14:54  OPEN           OK        GRP1_RWW_01       OPEN        PRIMARY   VALID    10       56226           56226           
[monitor]         2020-11-30 23:40:48: 收到守护进程(GRP1_RWW_02)消息
                  WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
                  2020-11-30 17:15:05  OPEN           OK        GRP1_RWW_02       OPEN        STANDBY   VALID    10       56226           56226  
ISTATUS、RSTAT   状态显示为以上图表示正常           

4.5 模拟故障自动切换

关闭主数据库服务器模拟主库故障,监视器会打印如下日志
[monitor]         2020-11-27 23:45:05: 检测到PRIMARY实例故障,开始对组(GRP1)执行自动接管
[monitor]         2020-11-27 23:45:05: 通知组(GRP1)当前活动的守护进程设置MID
[monitor]         2020-11-27 23:45:05: 通知组(GRP1)当前活动的守护进程设置MID成功
[monitor]         2020-11-27 23:45:05: 开始使用实例GRP1_RT_02接管
[monitor]         2020-11-27 23:45:05: 通知守护进程GRP1_RT_02切换TAKEOVER状态
[monitor]         2020-11-27 23:45:05: 守护进程(GRP1_RT_02)状态切换 [OPEN-->TAKEOVER]
[monitor]         2020-11-27 23:45:06: 切换守护进程GRP1_RT_02为TAKEOVER状态成功
[monitor]         2020-11-27 23:45:06: 实例GRP1_RT_02开始执行SP_SET_GLOBAL_DW_STATUS(0, 7)语句
[monitor]         2020-11-27 23:45:06: 实例GRP1_RT_02执行SP_SET_GLOBAL_DW_STATUS(0, 7)语句成功
[monitor]         2020-11-27 23:45:06: 实例GRP1_RT_02开始执行SP_APPLY_KEEP_PKG()语句
[monitor]         2020-11-27 23:45:06: 实例GRP1_RT_02执行SP_APPLY_KEEP_PKG()语句成功
[monitor]         2020-11-27 23:45:06: 实例GRP1_RT_02开始执行ALTER DATABASE MOUNT语句
[monitor]         2020-11-27 23:45:08: 实例GRP1_RT_02执行ALTER DATABASE MOUNT语句成功
[monitor]         2020-11-27 23:45:08: 实例GRP1_RT_02开始执行ALTER DATABASE PRIMARY语句
[monitor]         2020-11-27 23:45:08: 实例GRP1_RT_02执行ALTER DATABASE PRIMARY语句成功
[monitor]         2020-11-27 23:45:11: 通知实例GRP1_RT_02修改所有归档状态无效
[monitor]         2020-11-27 23:45:11: 修改所有实例归档为无效状态成功
[monitor]         2020-11-27 23:45:11: 实例GRP1_RT_02开始执行ALTER DATABASE OPEN FORCE语句
[monitor]         2020-11-27 23:45:13: 实例GRP1_RT_02执行ALTER DATABASE OPEN FORCE语句成功
[monitor]         2020-11-27 23:45:13: 实例GRP1_RT_02开始执行SP_SET_GLOBAL_DW_STATUS(7, 0)语句
[monitor]         2020-11-27 23:45:13: 实例GRP1_RT_02执行SP_SET_GLOBAL_DW_STATUS(7, 0)语句成功
[monitor]         2020-11-27 23:45:13: 通知守护进程GRP1_RT_02切换OPEN状态
[monitor]         2020-11-27 23:45:13: 守护进程(GRP1_RT_02)状态切换 [TAKEOVER-->OPEN]
[monitor]         2020-11-27 23:45:14: 切换守护进程GRP1_RT_02为OPEN状态成功
[monitor]         2020-11-27 23:45:14: 通知组(GRP1)的守护进程执行清理操作
[monitor]         2020-11-27 23:45:14: 清理守护进程(GRP1_RT_02)请求成功
[monitor]         2020-11-27 23:45:15: 使用实例GRP1_RT_02接管成功
[monitor]         2020-11-27 23:45:15:(GRP1)使用实例GRP1_RT_02自动接管成功

4.6 故障之后集群状态检查

[monitor]         2020-11-27 23:51:38: 守护进程(GRP1_RT_01)状态切换 [NONE-->OPEN]
                  WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
                  2020-11-27 17:25:45  OPEN           OK        GRP1_RT_01       OPEN        STANDBY   NULL     10       56226           56226           

[monitor]         2020-11-27 23:51:39: 守护进程(GRP1_RT_02)状态切换 [OPEN-->RECOVERY]
                  WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
                  2020-11-27 17:25:56  RECOVERY       OK        GRP1_RT_02       OPEN        PRIMARY   VALID    11       57584           57584           

[monitor]         2020-11-27 23:51:40: 守护进程(GRP1_RT_02)状态切换 [RECOVERY-->OPEN]
                  WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
                  2020-11-27 17:25:57  OPEN           OK        GRP1_RT_02       OPEN        PRIMARY   VALID    11       57584           57584 

总结

在搭建过程中如果出现问题,请检查配置!检查配置!检查配置!大部分情况是配置错了导致的问题。这个是配置两节点的方法,多节点的只需要在配置文件中对应的增加即可。

猜你喜欢

转载自blog.csdn.net/beatlove123/article/details/112364508