网卡丢包问题

关键词: 丢包  网卡  bond0 telnet tcpdump ifconfig 连接失败

一、故障表现

2018年1月11日下午18点,适配平台 192.168.120.1/2报警  日志提示 redis连接上不。

在120.1 上执行 telnet 192.168.120.2 6379 发现执行5次,有1次连接上不。现象看上去像网络不稳定。 

二、处理过程:

A. telnet 其它端口,看是否redis问题。  ------ 可排除是否应用问题。

120.1 上telnet 120.2 的22端口,发现失败率近20%。排除redis的问题。

B.  抓包分析tcp的握手建立过程,确认问题所有

使用tcpdump 抓两边的包,看tcp握手情况

120.1
120.2
 
tcpdump -s 0 -i bond0 dst port 9999 tcpdump -s 0 -i bond0 port 9999 双边都抓包
telnet 192.168.120.1 9999 nc -l 9999 在120.2上监听端口9999然后再120.1上发起telnet

结果如下:

结论:120.2回包正确,120.1收不到120.2返回的sync的ack确认包,所以120.1不停的重试。

基于以上分析,有两种可能:

  • 网络线路、路由问题等外部问题
  • 操作系统、网卡故障等主机类问题

继续使用排除法:由于外部问题不好定位,好么先确定主机问题。

使用ifconfig查看网络情况:

从图可见,bond0网卡 RX(接收) dropped掉大量包,正常情况应该是0。至此基本可确认是 bond0将收到的握手包drop掉了。

猜你喜欢

转载自www.cnblogs.com/hnhycnlc888/p/9708557.html
今日推荐