2021年1月15日10:36:06
昨晚19点发生了一排机器(不到10台)发生了重启,IDC的李工说超融合服务器的存储出问题了。无法远程服务器,访问web服务。我以为中招incaseformat病毒了。在23:30分修复成功,应该是存储问题,没中毒。
随后杀毒,net share xxx /delete 关网络共享等操作。
好巧不巧,半夜另一边的服务器有个web应用无法访问了。
http://113.xxx.xx.xxx:8001 (公网) 无法访问 (服务器为192.168.1.100)
但是telnet 113.xxx.xx.xx.xxx 8001是通的。
在1.100服务器,本地运行localhost:8001是正常运行系统的
随后换端口为8002 , 113.xxx.xxx.xxx:8002 和 localhost:8002都能正常访问。
这系统近几个月都是正常使用的,最近几周还搞了单点登录,个byd,也碰巧是昨晚出问题。
排查思路
排查思路:从内到外
1、本机localhost访问系统 , localhost:8080 、 192.168.1.100:8080
2、用旁边的机器(192.168.1.101),访问系统192.168.1.100:8080
telnet 192.168.1.100 8080 、或者curl
如果不通则检查1.100的防火墙 。 如果是域名连接的则看dns
3、检查外部问题
telnet 11x.xxx.xxx.xx 8080 看是否通
查看总的防火墙NAT做的映射是否通
nat server protocol tcp global 113.xx.xx.xx 8001 8010 inside 192.168.1.103 8001 8010
经过检查总防火墙的端口映射是通的。
深信服AD作为负载转发,如果还不通则查看1.103的AD设备配置情况
最后发现是内部机器防火墙问题,防火墙一直开启的,添加开放对应端口上去即可,但怪比了,它已经正常用了几个月了。