主机当前没有管理网络冗余

项目背景

项目实施过程中,发现某数据中心DC 的群集 DaaS-Mgmt 中的主机当前没有管理网络冗余(Hostcurrently has no management network redundancy)。
在这里插入图片描述
在这里插入图片描述
vSphere HA 已确定,只有一条路径供 vSphere HA 管理流量使用,导致单点故障。最佳实践要求,应有多条路径供 vSphere HA 用于检测信号和群集通信。出现网络故障后,具有单一路径的主机更可能被声明为已停止运行、网络已分区或已隔离。如果被声明为已停止运行,主机随后实际出现故障时 vSphere HA 将不会响应;如果被声明为已隔离,vSphere HA 可能应用隔离响应,从而影响虚拟机在主机上运行的正常运行时间。
【可能的原因】:
仅有一个端口组可用于 vSphere HA 通信 操作: 如果接受未对 vSphere HA 通信提供冗余的风险,则可以通过将 das.ignoreRedundantNetWarning 高级选项设置为“true”来消除配置问题

原因

1)如果服务控制台/VMkernel 端口管理网络内的网络冗余配置不正确,将显示此消息。可以放心地忽略此消息。
2)有时用于托管服务控制台/VMkernel 端口管理网络的 vSwitch 即使拥有两个可用上行链路来提供冗余,但仍显示此警告。

处理

第一种情况:未配置冗余uplink

可以按照VMware 建议您向配置了网卡绑定的服务控制台或管理网络 vSwitch 再添加一个 vmnic,并将两个 vmnic 都设置为活动适配器或者将其中一个置于待机模式。修改标准交换机的管理端口组的上行链路为2个网卡都用,基于IP HASH故障切换。
1)在群集中禁用 VMware High Availability,然后重新启用HA,尝试;
2)在 VMware High Availability (HA) 群集中的 ESXi 和 ESX 主机上禁止显示此消息,或者对于群集中已配置的主机也显示了该警告,请将 VMware HA 高级选项das.ignoreRedundantNetWarning设置为true,然后在该主机上重新配置 VMware HA。

将 das.ignoreRedundantNetWarning 设置为 true;
群集—>设置—HA---->高级选项,配置完成后,群集上传给你去HA以完成重新配置 vSphere HA
在这里插入图片描述
3)对ESXi and ESX检查配置端口绑定
3.1 检查确认主机标准交换机上联物理网卡适配器是2个,端口绑定策略
在这里插入图片描述

(1)Route based on the originating port ID(基于源虚拟端口的路由):根据流量进入虚拟交换机的虚拟端口选择一个上行链路。这也是默认的负载均衡策略。如果物理交换机使用链路聚合,则必须使用基于IP哈希负载平衡的路由,确保在物理交换机端口上正确配置了VLAN和链路聚合协议(如果有)。
(2)Route based on an IP hash(基于IP哈希的路由):根据每个数据包的源和目标IP地址的哈希值选择一个上行链路。对于非IP数据包,将使用那些偏移量处的值来计算哈希值。
(3)Use explicit failover order:(使用明确的故障切换顺序:) 始终使用通过故障切换检测标准的活动适配器列表中最高顺序的上行链路,即始终用排在最前面的uplink。
(4)oute based on a source MAC hash(基于源MAC哈希的路由):根据源以太网的哈希值选择一个上行链路。
(5)Route based on physical NIC load (Only available on Distributed Switch)(基于物理NIC负载的路由(仅在分布式交换机上可用)):根据当前物理NIC的负载选择一个上行链路。
在这里插入图片描述
如上图所示,添加网络时,可编辑–Teaming and Failover,确保选定的适配器在“活动适配器”下。

用于虚拟机网络的NIC组提供了额外的容量以及故障转移功能,如果其中一个网络适配器发生故障,则端口组仍保持与网络的连接。理想情况下,VMotion上行链路与其他ESX Server主机的vMotion端口一起连接到其自己的子网,以将其流量与虚拟机和服务控制台流量分开,以最大程度地提高性能。可以将一个附加的网络适配器上行到虚拟交换机1,以在服务控制台(管理)接口上提供故障转移,或者上行到新的虚拟交换机2,以提供iSCSI或NFS存储(最好在其自己的子网上)。

经检查我属于第2种原因现象:

第2种情况:配合了冗余uplink,仍提示未冗余

即使主机托管服务控制台/ VMkernel端口管理网络的vSwitch有两个可用的上行链路,上述错误消息也会显示在主机的“摘要”选项卡中,提示未提供冗余。

【处理过程】
1、选中问题主机---->Reconfigure HA----->禁用然后重新启用HA,推送HA代理并导致这些警报停止。
2、或者ssh以root登录到所在主机,执行
/sbin/services.sh restart //启动esxi的ssh
service mgmt-vmware restart //重启HA代理
3、如重启HA报类似如下错误:
HA agent on xxxxxx in cluster xxxxx in xxxxxxx has an error: error while running health check script
将所在集群主机至于维护模式,关闭DPM后,重启HA;

猜你喜欢

转载自blog.csdn.net/ximenjianxue/article/details/107672430