vsphere的一次客户故障记录-VMware vSphere HA主机状态故障

问题及解决过程:
客户的vsphere集群有两台主机的管理网络不太稳定,今天突然报故障说新建的虚拟机都报故障主说不受vsphereHA的保护,登录管理界面,有台主机报错vsphere ha主机初始化错误,客户已做虚拟机迁移,但有一台虚拟机始终不能迁移,将其关闭,主机才能进入维护模式。分析是这台主机一直有业务所以不能热迁导致。重启主机,报错未变!vsphere ha主机初始化错误!。这个犯难了!难道vsphereHA出问题了?
经过观察,发现其它主机没有报警,但主机都是处于选举状态,右键重新vsphereHA配置,也变成vsphere ha主机初始化错误报警,这下越修问题越多了,又多了个主机报警了。
重新观察,发现整个集群只有两个主机是处于主从状态的。冒险将处于主的主机右键重新vsphereHA配置,等待之后,好事出现,所有主机的HA选举状态都稳定了,新建的虚拟机所报故障自动消失!HA集群先报警后报警消失。问题解决!
分析
VMware vSphere HA主机状态故障在未重建稳定状态之前,故障主机不报警导制刚开始的判断方向错误!下次一定要注意,本次故障初步分析是由于HA的故障机数设置为2,当同时两台管理网络不稳的主机同时报错时,HA集群失效从而导制新建虚拟机报不能被保护的警告,但主机在失效的HA集群中并不报警。将HA的设置中故障机数设置改为3,看以后的效果吧!
总结
在主机数比较多的vspherHA集群中,可适当将HA的设置中故障机数设置加大,可增加集群的稳定性!

猜你喜欢

转载自blog.csdn.net/seaship/article/details/89206488