本文接该系列文章的上一篇:ADG架构搭建4 – 搭建一主两备ADG架构
前言
在《ADG架构搭建3 – 一主一备ADG主备切换》一文中,已经带领大家完成了一主一备ADG的主备切换,相信大家对该部分内容已有所了解。本文将对《ADG架构搭建4 – 搭建一主两备ADG架构》中搭建的一主两备架构进行主备切换的演示。
正文
Oracle Dataguard的角色转换包含两类:Switchover和Failover。Switchover指主备之间角色转换,主库降为备库,备库升级为主库。而failover则是指主库出现问题时,备库切换为主库。
一、物理Standby的Switchover(无损切换)
Switchover,无损切换一般是用用户手动触发或有计划的进行触发来进行主从库切换,比如软硬件升级等需求。
其执行分为两个阶段。第一步,primary库转换为standby角色;第二步,standby库转换为primary角色。
当前各数据库角色及切换目标说明如下:
数据库IP | tnsname | 原角色 | 目标角色 |
---|---|---|---|
192.168.10.13 | ruiadg1 | Rrimary | Standby |
192.168.10.14 | ruiadg2 | Standby | Rrimary |
192.168.10.15 | ruiadg3 | Standby | Standby |
1.迁移前检查
确认主备库的角色:
--主库(ruiadg1)执行
SQL> select name,DATABASE_ROLE from v$database;
NAME DATABASE_ROLE
--------- ----------------
RUIADG PRIMARY
--两备库执行
SQL> select name,DATABASE_ROLE from v$database;
NAME DATABASE_ROLE
--------- ----------------
RUIADG PHYSICAL STANDBY
检查主备库间有没有延迟:
--主库(ruiadg1)执行
SQL> select value from v$dataguard_stats where name='transport lag';
no rows selected
SQL> select value from v$dataguard_stats where name='apply lag';
no rows selected
补充:如果有,检查最新归档到的日志号及是否有gap,命令如下:
SQL> SELECT UNIQUE THREAD# AS THREAD, MAX(SEQUENCE#) OVER (PARTITION BY thread#) AS LAST from V$ARCHIVED_LOG;
SQL> SELECT THREAD#, LOW_SEQUENCE#, HIGH_SEQUENCE# FROM V$ARCHIVE_GAP;
检查归档日志有没有中断:
--主库(ruiadg1)执行
SQL> select status, GAP_STATUS from v$archive_dest_status where dest_id=2;
STATUS GAP_STATUS
--------- ------------------------
VALID NO GAP
SQL> select status, GAP_STATUS from v$archive_dest_status where dest_id=3;
STATUS GAP_STATUS
--------- ------------------------
VALID NO GAP
2.执行切换
检查主库(ruiadg1)是否支持Switchover操作:
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
--------------------
TO STANDBY
若得到“SESSION ACTIVE”或“TO STANDBY”信息就表明Primary库支持转换为Standby角色,否则就需要检查参数文件。SESSIONS ACTIVE说明还有活跃会话。
切换当前主库(ruiadg1)为物理备库:
切换完成后,数据库会被关闭
SQL> alter database commit to switchover to physical standby;
启动数据库(ruiadg1)到mount状态:
当前已经变成备库
SQL> startup mount
查询数据库(ruiadg1)切换状态:
此时状态发生变化
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
--------------------
RECOVERY NEEDED
查询此时数据库ruiadg1)的角色:
角色为:PHYSICAL STANDBY
SQL> select DATABASE_ROLE from v$database;
DATABASE_ROLE
----------------
PHYSICAL STANDBY
检查两备库(ruiadg2,ruiadg3)是否支持转换为Primary角色:
此时因为原来的主库已经切换到的备库,则这两个备库是可以切换到主库了,状态为:TO PRIMARY
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
--------------------
TO PRIMARY
此时待转换的Standby库switchover_status列值应该是“TO PRIMARY“如果不是就需要检查初始化参数文件。
补充:如果发现not allowed状态,若能确定切换前主从是同步的,可以忽略Not Allowed 状态直接进行switchover。
将备库1(ruiadg2)切换为主库:
一旦切换到主库,数据库此时为mount状态
SQL> alter database commit to switchover to primary;
Database altered.
查备库1(ruiadg2)修改后的角色:
SQL> select name,DATABASE_ROLE from v$database;
NAME DATABASE_ROLE
--------- ----------------
RUIADG PRIMARY
打开新主库/原备库1(ruiadg2):
SQL> alter database open;
打开原主库/新备库1(ruiadg1)到只读:
SQL> alter database open read only;
或
SQL> alter database open;
在原主库/新备库1(ruiadg1)开启日志的应用:
SQL> alter database recover managed standby database using current logfile disconnect from session;
3.切换后验证
新主库(ruiadg2)构造测试数据:
SQL>insert into test1 values ('rui',32);
SQL>commit;
手动切换新主库(ruiadg2)log:
SQL> alter system switch logfile;
检查两备库数据是否同步:
select * from test1;
查询日志是否应用到最新状态:
SQL> select distinct thread#,applied,max(sequence#) over(partition by thread#) a from v$archived_log;
经验证,数据同步无异常。
二、物理Standby的Failover(灾难性恢复)
Failover一般表示Primary数据库瘫痪或至少无法启动,这种转换已不能在Primary数据库上做任何操作,只要更改Standby数据库的角色为primary。
注意:
1)Failover之后原primary数据库默认不再是Data Guard配置的一部分。
2)对于多Standby的情況,其他standby数据库不直接参与Failover的过程,因此这些数据库不需要做任何操作。
3)一般情況下,新的primary数据库配置后,要建立新的Standby数据库。
当前各数据库角色及切换目标说明如下:
数据库IP | tnsname | 原角色 | 目标角色 |
---|---|---|---|
192.168.10.13 | ruiadg1 | Standby | Rrimary |
192.168.10.14 | ruiadg2 | Rrimary | Standby |
192.168.10.15 | ruiadg3 | Standby | Standby |
1.主库故障模拟
把主库(ruiadg2)关闭,模拟为主库损坏
SQL> shutdown immediate;
2.切换前准备
检查两备库是否有日志没有同步:
SQL> SELECT THREAD#, LOW_SEQUENCE#, HIGH_SEQUENCE# FROM V$ARCHIVE_GAP;
no rows selected
沒有返回结果就说明归档日志是连续的。
补充:如果此查询有记录,需要把这些日志从主库拷贝到备库,并注册到数据库(加入到数据字典)中:
SQL> ALTER DATABASE REGISTER PHYSICAL LOGFILE 'xxx';
查询两备库日志是否应用到最新状态:
--备库1(ruiadg1)
SQL> select distinct thread#,max(sequence#) over(partition by thread#) a from v$archived_log;
THREAD# A
---------- ----------
1 44
--备库2(ruiadg3)
SQL> select distinct thread#,max(sequence#) over(partition by thread#) a from v$archived_log;
THREAD# A
---------- ----------
1 42
3.主备切换
在备库1(ruiadg1)做失败切换:
SQL> alter database recover managed standby database finish ;
Database altered.
切换备库1(ruiadg1)的角色为primary:
SQL> alter database commit to switchover to primary;
Database altered.
启动新主库/原备库1(ruiadg1):
SQL> alter database open;
Database altered.
查看新主库/原备库1(ruiadg1)当前角色:
SQL> select name,DATABASE_ROLE from v$database;
NAME DATABASE_ROLE
--------- ----------------
RUIADG PRIMARY
4.原主库(ruiadg2)处理
前面已经说到,Failover之后原主库默认不再是Data Guard配置的一部分。所以,在将ruiadg1切换为主库后,原主库(ruiadg2)需要重新做数据同步,使其称为ADG的备库。
SQL> shutdown immediate
SQL> startup nomount
$ rman target sys/rui@ruiadg1 auxiliary sys/rui@ruiadg2
RMAN> DUPLICATE TARGET DATABASE for standby FROM ACTIVE DATABASE nofilenamecheck;
SQL> alter database open;
SQL> alter database recover managed standby database disconnect from session;
SQL> select name,DATABASE_ROLE from v$database;
NAME DATABASE_ROLE
--------- ----------------
RUIADG PHYSICAL STANDBY
5.数据同步测试
在新主库(ruiadg1)执行如下操作:
SQL>insert into test1 values ('rui',36);
SQL>commit;
在新主库(ruiadg1)手动切log:
SQL>alter system switch logfile;
检查主备库数据是否同步:
select * from test1;
经检查,主库数据已同步至两备库。