VSAN6.7 硬盘特殊故障导致1台ESXI主机磁盘组offline处理方法

首先说明vsan集群搭建方式 Dell RX740xd 5台,每台主机2个磁盘组,每个磁盘组1块1.6TSSD,7块1.8Tsas盘组成
磁盘组采用直通模式,未设置raid模式。
故障表现: idrac下查看主机硬件一切正常,磁盘正常,vcenter下 vsan监控运行状态图
VSAN6.7 硬盘特殊故障导致1台ESXI主机磁盘组offline处理方法
VSAN6.7 硬盘特殊故障导致1台ESXI主机磁盘组offline处理方法
192.168.5.3这台主机2个磁盘组出现掉线,无法查看磁盘组。故障表现为:
1.这台主机进入维护模式表现进度条一直卡在45%或68%。
2.ssh连接主机使用esxcli vsan storage list 不显示内容。
ssh连接这台esxi主机,通过/var/log下的日志查看vobd.log、vmkernel.log ,vmkwarning.log,发现一块磁盘有问题。日志图如下:
VSAN6.7 硬盘特殊故障导致1台ESXI主机磁盘组offline处理方法![]
VSAN6.7 硬盘特殊故障导致1台ESXI主机磁盘组offline处理方法
发现这台主机naa.50000399683a3c0d磁盘有问题。由于这块硬盘没有完全损坏,导致整个主机磁盘组i/o卡死。
如何更换这块故障磁盘?更换这块磁盘存在的风险未知
1.无法正常按照故障磁盘更换步骤操作,选定磁盘组-移除磁盘(无法操作)
2.命令行esxcli vsan storage remove -d naa.id -m no Action (命令也无法执行)
咨询工程师没有更好的意见。直接拔插故障硬盘是否有风险呢?经过判断,直接拔插应该没有风险,VSAN存储策略PFTT=2.
果然,dell更换硬盘工程师按照我的意见,直接拔下故障硬盘。一切正常。2个offline磁盘组可以看到磁盘了。然后按照正常更换故障容量盘的操作故障恢复。
此次故障的风险在于能否直接拔插故障硬盘?经过测试,直接拔插1块硬盘不会有影响,只是提示该磁盘组absent 硬盘(VSAN PFTT=2的情况下,其他情况未经过测试)。

猜你喜欢

转载自blog.51cto.com/sunkiss/2642346