注:近日所管理的vsphere集群中出现vcenter不能使用的情况,排查后解决,在此记录下排查过程。
发现问题与初步处理
登陆vcenter时卡再登陆界面
登录到vcenter所在的宿主机,对其进行重启
重启后界面出现 503 Service,等待半小时以上补发切换状态。
登录vcenter所在ip的5480端口,发现vcenter-service没有启动尝试在界面中启动,无法成功。
查阅相关资料并验证
在网上查阅资料找到了两种种致使vcenter无法启动的原因
1. 文件系统写满
ssh到vcenter后使用df -h 未发现写满的分区。
2. DB中网络适配器写满
按参考文献方式操作数据库未发现存在异常网卡。
扫描二维码关注公众号,回复:
8610446 查看本文章
排查与定位
ssh 登录到vcenter后台 查看vpxd的日志
grep error /var/log/vmware/vpxd/vpxd* | more
/var/log/vmware/vpxd/vpxd-104.log:2020-01-13T14:18:46.807Z error vpxd[05280] [Originator@6876 sub=vmomi.soapStub[12]] initial service state request failed, disabling pings. error=HTTP Status:400 'Bad Request'
因而怀疑网络问题出现问题查看网络配置
ssh到vcenter分别ping网关,同网段其他虚拟机,以及DNS,发现无法ping通DNS。
解决网络问题后重启vcneter后,vcenter正常工作
参考文献