记一次流量异常分析案例

突然有一天在看boss在看服务器流量的时候说:“为什么有的时候流量会达到120m??分析一下”

好吧,这个对我来说是难题,从来没有分析过服务器流量,只使用过wireshark来分析过流量。开始分析吧!

首先,来看zabbix的监控流量表,发群确实是,在同一时间段,所有的集群服务器的流量突然升高,而且高达几百兆的上传下载速度。看到这里真的不知道是什么原因。


在看了好几个服务器的流量图之后,还是准备了几种方法来分析一下!

一。网络问题

二。监控一下流量

三。查看系统日志

A:由于公司的所有资产都是我在维护和安装调试,服务器在安装的时候也没有对网卡设置太多。

    关闭DHCP,改由静态ip

    1000m的传输速度,全双工

    公司网速下载大概800m,上传大概60m

由于不确定是不是网卡设置问题或者是被黑了,暂时放下

B:使用iftop来监控流量,发现这个货监控的是实时的流量,并不能查看某一个时间段的流量,并且在监控过程中,流量也没有特别大


 如果要是记录实时日志,那个这日志也太大了,万一这一天的时间内没有 流量正常怎么办??

三。还是查看日志吧

在centos7中大部分日志默认放在/var/log中

/var/log/messages ---> 整体系统信息,其中也包含系统启动期间的日志。
/var/log/dmesg ---> 内核缓冲信息(kernel ring buffer)。用dmesg查看系统启动信息。
/var/log/auth.log ---> 系统授权信息,包括用户登录和使用的权限机制等。
/var/log/boot.log ---> 系统启动时的日志。
/var/log/daemon.log ---> 系统后台守护进程日志信息。
/var/log/dpkg.log ---> 安装或dpkg命令清除软件包的日志。
/var/log/kern.log ---> 内核产生的日志。
/var/log/lastlog ---> 记录所有用户的最近信息。用lastlog命令查看内容。
/var/log/maillog 或 /var/log/mail.log ---> 电子邮件服务器的日志信息。
/var/log/user.log ---> 记录所有等级用户信息的日志。
/var/log/alternatives.log ---> 更新替代信息都记录在这个文件中。
/var/log/btmp ---> 记录失败登录信息。使用last命令查看,例如:last -f /var/log/btmp | more。
/var/log/cups ---> 涉及所有打印信息的日志。
/var/log/anaconda.log ---> Linux系统安装信息。
/var/log/yum.log ---> 使用yum安装的软件包信息。
/var/log/cron ---> crond计划任务服务执行情况。
/var/log/secure ---> 系统安全日志、验证和授权信息。
/var/log/wtmp或/var/log/utmp ---> 登录信息。使用 w/who/finger/id/last/lastlog/ac 进行查看。

/var/log/faillog ---> 用户登录失败信息。

查询所有日志,在流量升高的时间段里面,没有任何进程能到百兆以上的上传下载速度。

再仔细思考和查看流量之后,发现这些服务器同处于一个集群,在同一时间内,几乎所有的流量都达到百兆以上。会不会是在集群内进行传输数据??

后来在日志里面查看了一下发现hadoop集群会在下载完数据之后,会进行数据的整理,什么时候下载完,什么时候进行汇总。所以,流量异常升高的时间段也不尽相同。

猜你喜欢

转载自blog.csdn.net/qq_15760109/article/details/80886189