华为云计算IE面试笔记-华为FusionSphere容灾方案中有哪两种组网方案规划,简单描述一下两种技术的原理?描述主机复制组网方案的规划设计要点?

主机复制容灾:利用主机的IO复制镜像功能(IO Mirror模块)和VRG虚拟复制网关,将生产站点上虚拟机的数据远程复制到容灾站点,实现容灾。

存储阵列复制容灾:利用存储设备的远程复制技术(hyperereplication),将数据从生产中心复制到灾备站点,实现容灾。

主机复制容灾规划设计要点:

1. 规划前提:根据客户的需求收集要容灾的应用类型,IOPS(每秒传输的最大字节数)是多少,数据块的大小,要容灾多少虚拟机,客户对容灾的RTO和RPO的需求是多少。

            RTO:允许业务中断的最大时间  

            RPO:允许数据的最大丢失量(每秒丢失的数据量)

2. 网络带宽的规划分为管理链路和IO链路,IO链路分为初始复制带宽和增量复制带宽,管理链路不小于10mbps的带宽,IO链路不小于50mbps的带宽

IO 复制带宽:

根据复制周期内平均写业务IOPS计算: 
主机复制容灾=保护的虚拟机数量*每个虚拟机周期内业务繁忙期间平均写业务 IOPS*数据块大小*8÷0.7(8 是换算单位;0.7 是带宽利率系数) 
    根据复制周期内所有数据变化量计算: 
存储复制容灾=保护的虚拟机数量*虚拟机复制周期内平均变化数据量(MB)*8/(复制周期(分钟)*60)

3. 生产/容灾系统配置的规划:

①规划MAC地址,分为两部分,生产站点一部分,容灾站点一部分,并且不能重复。

②确定容灾虚拟机的类型和数量。

③数据存储的规划,灾备站点一般是预留20%。

④对VRG数量的决定,一对 VRG 可保护虚拟机数量不超过 150 个,可保护虚拟机磁盘不超过200 个,根据需要保护的虚拟机数量进行规划,有计算公式可以得出。  VRG是虚拟复制网关,装在两个CNA节点上用于数据的传输。

⑤设置快照执行周期。

VRG数量: 

SAN 存储场景:

VRG数量=MAX(所有需容灾虚拟机写lOPS总和/500,所有需容灾虚拟机的磁盘总数/200,所有需容灾虚拟机数量/150),如遇小数,向上取整 

FusionStorage场景:

VRG数量=MAX(所有需容灾虛拟机写lOPS总和/1500,所有需容灾虚拟机磁盘总数/200,所有需容灾虛拟机数量/150),如遇小数,向上取整。 

生产与容灾站点VRG需一一对应,且与主机绑定,每个主机上最多只能部署一个VRG。
如果两端数据存储形态不一致,以VRG数量最多的一端为准。

4. 生产站点的规划:

①首先在容灾平台上去配置一些映射关系,包括云平台、VRG、存储、集群、主机、端口组的关系等。

②然后就是在VRG部署时,知道他的规格,至少要有2个CPU、6G内存,15G系统盘,100G的数据盘。  VRG的规格官方要求是不可进行调整的。

③然后是数据存储的规划,首先都是要选择一个虚拟化的一个数据存储,并且VRG虚拟机建议使用独立的数据存储,不和其他的容灾虚拟机使用相同的数据存储。

5. 容灾站点的规划和生产站点的规划基本相同,就是在数据存储这一块需要预留,数据存储的容量这块要多预留20%

存储复制容灾的远程复制技术分同步远程复制和异步远程复制,同步是先写入RM模块,然后RM模块对两端进行双写,写完返回成功IO算写完成。异步是先写入主cache,就返回写成功的IO,然后写入主存储,打快照,再写入到远端的存储中。

FusionSphere主备容灾存储复制容灾的组网

实现两BCManager 通信。可以单独网络,通过打通两管理平面实现。

存储设备需要接入管理网络,被BCManager 接管

两站点存储设备通过两站点的存储层网络设备链路实现数据容灾

存储复制容灾实现的本地高可用、双活、两地三中心,与通用容灾组网类似

1、定义:左边为生产数据中心,右边为灾备数据中心,我们要将生产数据中心中的lun的数据灾备到灾备数据中心,通过BCM接入生产端存储、灾备端存储,通过创建保护集、保护策略、保护计划,待同步周期到来,将数据从后端存储链路传递至灾备端。

2. RPO、RTO趋近于0

3、实现原理

4、限制条件:1、必须是华为存储设备

2、必须有后端存储链路

3、设备必须支持高级特性(中高端存储)

FusionSphere主备容灾主机复制容灾的组网

存储平面无需打通

BCManager无需管理存储设备

建议给CNA节点单独配置容灾业务管理接口,让其与VRG通信,不配置则走CNA管理接口

VRG与VRG之间通信需要配置主机IO 复制平面

VRG需要被BCManager接管

1. 实现两BCManager 通信。可以通过打通两管理平面实现,也可以单独网络。

2. VRG虚拟复制网关需要三个平面,有三个网卡:VRG与VRG、与CNA互通、与BCM互通:BCM下发策略给VRG执行。

3. BCManager上配置好了保护对象和保护策略,对主机业务进行保护。

I/O过程

①VM发起IO流,生产站点CNA收到后会进行IO双写,一份写入生产存储,一份通过I/O Mirror捕获发给本端VRG

②本端VRG将I/O数据压缩、加密通过主机复制平面发送给容灾端VRG

③容灾端VRG对I/O数据进行解压缩、解密路由至相应CNA主机

④容灾站点CNA主机把数据写入备份存储

当灾难发生的时候,上层的BCManager发现生产端站点故障,它会将灾备端备份存储中的数据挂载给灾备端的灾备VM(灾备VM是一个空VM,只有灾难发生时才会拉活),完成业务拉起。

1、定义:左边为生产数据中心,右边为灾备数据中心,将生产数据中心中的数据通过VRG传输至灾备数据中心。通过BCM接入生产端VRG备端VRG,建立保护集、保护策略、保护计划,待通过周期到达后,将生产端数据通过主机IO复制网络平面传输至灾备端

2、RPO:趋近于0  RTO:异步 分钟级

3、限制条件:1、适用于FusionSphere环境

2、只能使用异步方式

4、实现原理

保护集

保护策略:计算(主机、集群)、存储(数据存储上)、网络(DVS上)

保护计划

*VRG的作用?

1. 聚合虚拟机的IO 数据并经过压缩、加密后发送到远端站点。

2. 接收远端站点数据,并将数据路由发送到指定的主机上。

3. 提供复制策略下发、状态查询等管理接口。

*一对 VRG 能否对多台 CNA 上的虚拟机进行容灾? 

部署的 VRG 数量依赖于网络、存储等多种因素,建议每对 VRG 配置的虚拟机个数不超过 150 个,所有虚拟机磁盘总个数不超过 200 个。

<引伸: 生产站点和灾备站点都需要部署 VRG 虚拟机,且部署方式为一对一部署 >

*主机复制与存储复制适合于哪些场景?

主机复制适合的场景:

主机复制容灾定位服务于中小型企业非关键性业务,建议支持的业务有 ERP (Enterprise Resource Planning)、邮件服务器和桌面云等。

存储复制适合场景:

1. 使用华为SAN设备,站点间通过IP 网络连接。

2. 不希望生产中心与灾备中心的距离受到限制。

3. 希望对虚拟机进行计划性的跨站点迁移。

4. 站点中业务需要连续性保护。

5. 存在虚拟机启动优先级、依赖关系等复杂的恢复场景。

6. 容灾演练具有较高优先级。

<关键点:

主机复制的RPO为分钟级,RTO为秒级,如果有更高的容灾要求,那么需要存储复制实现,如双活数据中心。

出于稳定性考虑,关键性业务不适合主机复制场景

主机复制只适合于FusionSphere场景

>

*一对 VRG 保护的虚拟机超过 150 个虚拟机怎么办? 

再部署一对 VRG 然后在 BCManager 上关联 VRG

*基于主机复制

CNA 主机上必须要有 IOMirror 模块,且 CNA 上虚拟机的 IO 能被其捕获到,通过 CNA 的IOMirror 模块完成数据的镜像 IO。

*VRG 之间用了 FusionCompute 上的啥功能:

IO mirror

*为什么主机复制不可以使用FusionStorage为数据存储?

虚拟化数据存储特指由 CNA 自身实现的虚拟化特性,例如快照、精简磁盘等,即对应存储虚拟化为主机存储虚拟化+文件系统。FusionStorage 支持虚拟化特性,是通过 FusionStorage存储系统自身机制实现的,但 CNA 并未参与,因此 FusionStorage 不是虚拟化数据存储。

*那只有 FusionStorage 作为存储的时候,就无法实现主机复制? 

当虚拟机的基本块设置设为支持时,源端支持 FusionStorage 虚拟化存储。

*主机复制、存储复制容灾二者区别?

1、在数据容灾的实现方式上是不同的。主机复制容灾通过部署 VRG 的 VM 将数据从生产站点传送到生产站点。存储复制容灾是采用两站点之间阵列复制实现的。

2、RPO、RTO 值不同。主机复制秒级分钟组;存储复制中两个值比较灵活。

3、应用场景。主机复制应用于中小企业非关键性业务;存储复制应用于所有,重点在关键业务中应用。

4、虚拟化平台限制原因不同。主机复制只应用于华为 FusionCompute。

5、两站点距离不同。主机复制更小些。

6、存储复制对上层应用无限制,主机复制限制为 FusionSphere。

7、主机复制应用 VRG,消耗计算节点的计算资源。

8、存储复制可以同步/异步传输数据,主机复制只可以异步。

FusionSphere 主机复制场景的规划?

1. 两端 BCManager 通信实现:可以打通两数据中心的管理平面,或者单独网络。

2. BCManager 部署模式:分布式部署与灾备站点部署一个。

3. BCManager 通信链路带宽一般为 10Mps。

4. 主机 IO 复制链路需要根据复制周期内平均业务 IOPS 计算。

5. 计算公式:保护虚拟机数量*每个虚拟机周期内业务繁忙期间平均写业务IOPS*数据块大小*8/0.7(带宽利用率系数)

6. VRG 部署数量:一对 VRG 可保护虚拟机数量不超过 150 个,可保护虚拟机磁盘不超过200 个。根据需要保护虚拟机数量进行规划。

7. BCManager 上保护组、保护策略、恢复计划等规划。

8. Domain0 规格调整。Domain 0 内存大小需要在原有基础上增加 4GB。

FusionSphere 容灾的两种方式 

可以实现多活和主备:

1. 存储层 hypermetro 特性,实现多活

2.  VRG,只能实现主备

存储复制容灾和主机复制容灾

通过存储复制容灾,容灾全景图中的所有的容灾方案都适合,并无特殊之处。

主机复制容灾,只适合于主备容灾场景,因其通过 VRG完成数据容灾,RPO、RTO 值都大于0。

基于主机复制容灾,生产端会打快照吗?

不会,因为 IO 的流动是通过 IOmirror 来完成的,IOmirror 不需要快照技术去提供支持。

虚拟机热迁移中的完整迁移,存储也是没有打快照的。

VRG 的组网、功能和限制

 

VRG 的规格:2CPU、6G内存、15G系统盘、100G数据盘(logcache 盘:用于存储异步传输的 IO)

主机层复制的 IOMirror 是如何把数据传给 VRG 的?

IOMirror 首先从名字上来说,它会把数据相当于镜像,然后将镜像过的数据通过 IP 转发给VRG,在主机复制的场景当中,需要给 CNA 主机添加“虚拟机容灾数据流量业务管理接口”。

VRG 进行主机复制容灾,它是同步还是异步,还是二者都有?

只有异步。RPO>0 秒   RTO>0 分钟

10 个 LUN 映射给 10 个主机,选择什么容灾?

在华为针对虚拟化平台的容灾方案中,我会选择主机复制容灾,原因是这 10 个 LUN 中有可能存在不需要保护的 VM,主机复制容灾的精度可以做得更高一些。

如果在FusionCompute场景下,肯定会使用华为的主机复制容灾解决方案,如果是其它虚拟化场景,如 KVM、VMware 场景下,我会寻找跟 FusionCompute 主机复制容灾解决方案类似的解决方案,假设如果找不到一个主机层面上的解决方案的话,我会尝试将这 10 个 VM 迁移至同一个LUN 当中,然后采用存储阵列复制容灾,如果不可以的话却一定要实现容灾的话,那就只能进行存储阵列复制容灾解决方案。

容灾网络带宽应该从哪些方面考虑:

虚拟机数量、数据量,同步复制还应考虑数据变化量(闲时和忙时)

主机复制、存储复制实现原理?

主机复制:

步骤如下:

1、 创建需保护虚拟机并安装部署好软件与数据。  

2、 配置站点信息。 配置站点间资源映射关系。(集群,主机,端口组,数据存储) 

3、 配置 VRG 上要复制的虚拟机  

4、 自动创建占位虚拟机,用以备份容灾虚拟机的数据,以便在容灾虚拟机故障后进行数据恢复。 

5、 创建虚拟机保护组,选择要保护的虚拟机,并设置保护策略。 

6、 容灾保护相关配置数据同步。 

7、 针对保护策略创建恢复计划,配置虚拟机启动顺序。 

8、 根据保护策略定期对占位虚拟机创建虚拟机快照(防止同步过程中数据损坏,而导致数据不可用) 

存储复制:

步骤如下:

1、 生产站点中创建主 LUN;

2、 将主 LUN 映射到 FusionCompute 环境中,且将容灾 VM 部署到数据存储中

3、 容灾站点创建从 LUN,大小与主 LUN 相同;

4、 生产站点配置远端设备,配置 LUN 远程复制关系与一致性组;

5、 在 BCManager 中配置站点间资源映射关系;(集群,主机,端口组的映射)

6、 在 BCManager 中注册存储设备,发现远程复制 LUN 与一致性组;

7、 在 BCManager 中创建保护组。

8、 创建保护策略

9、 容灾保护相关配置数据同步;

10、针对保护策略创建恢复计划,配置 VM 启动顺序

为什么主机复制需要虚拟化数据存储? 

因为实现主机复制过程中,需要根据保护策略定期对占位虚拟机创建虚拟机快照。

主机复制、存储复制配置过程?

FusionSphereOpenstack 容灾组网设计

容灾模块设计

 

 

桌面云容灾组网和实现原理

 

 

 

 

     

。FusionSphere 主机复制场景的规划? 

1. 两端 BCManager 通信实现:可以打通两数据中心的管理平面,或者单独网络。 

2. BCManager 部署模式:分布式部署与灾备站点部署一个。 

3. BCManager 通信链路带宽一般为 10Mps。 

4. 主机 IO 复制链路需要根据复制周期内平均业务 IOPS 计算。 

5. 计算公式:保护虚拟机数量*每个虚拟机周期内业务繁忙期间平均写业务 IOPS*数据块大小 *8/0.7(带宽利用率系数) 

6. VRG 部署数量:一对 VRG 可保护虚拟机数量不超过 150 个,可保护虚拟机磁盘不超过 200 个。1100 个 IOPS 根据需要保护虚拟机数量进行规划。 

7. BCManager 上保护组、保护策略、恢复计划等规划。

。VRG 有几个网卡?分别有什么作用?

三张网卡

1. 用于和BCManager通信,需要配置为和BCManager虚拟机相通的分布式交换机和端口组。

2. 用于和CNA主机通信,用于和主机的业务管理接口通信,需要配置为和主机业务管理接口相通的分布式交换机和端口组。

3. 用于和对端站点的 VRG 通信,需要配置为和对端站点相通的分布式交换机和端口组。

。主从切换和容灾演练区别?主从切换如何实现的?

主从切换:从 LUN 升为主 LUN

容灾演练区别:没切换LUN

主从切换:一键式计划迁移,一键式故障恢复里面都有主从切换

。基于存储复制一键式容灾测试与清理

。基于存储复制的一键式故障恢复

。基于存储复制的一键式计划性迁移

。基于主机复制的一键式容灾测试与清理

。基于主机复制一键式故障恢复

。基于主机复制的一键式计划性迁移

。容灾测试、故障恢复、计划性迁移的区别

1) 对生产站点的影响:

容灾测试前、后,生产站点都保持正常的运行状态,容灾测试对生产站点无影响。

故障恢复前,生产站点已故障,仅在容灾站点作相应操作,拉起容灾业务

计划性迁移前,生产站点正常,计划性迁移后,业务切换到容灾站点,生产站点业务停止

2) 价值:

 容灾测试用来验证复制到灾备站点的数据的可用性或快照的可用性

 故障恢复可以在生产站点发生灾难时,一键式拉起容灾业务

 计划性迁移在非灾难性停止前,可以提前切换业务,减少停机对业务的影响

3) 实现的方式

 详见前面的每个步骤。

考试追问:

VRG之间的带宽单位是什么? 

mb/s

VRG的带宽为什么需要乘8?

单位的换算。字节转比特 1B=8b

数据块大小单位?

MB

为什么需要乘虚拟机业务繁忙时的IOPS?

因为不以繁忙时带宽计算带宽,可能会数据传输效率低。

业务繁忙时的iops数据如何计算?

具体说下VRG怎么部署,操作?

生产站点与灾备站点一一对应,且与主机进行绑定。

猜你喜欢

转载自blog.csdn.net/weixin_42592728/article/details/120470818