记一次流量异常分析案例

突然有一天在看boss在看服务器流量的时候说：“为什么有的时候流量会达到120m？？分析一下”

好吧，这个对我来说是难题，从来没有分析过服务器流量，只使用过wireshark来分析过流量。开始分析吧！

首先，来看zabbix的监控流量表，发群确实是，在同一时间段，所有的集群服务器的流量突然升高，而且高达几百兆的上传下载速度。看到这里真的不知道是什么原因。

在看了好几个服务器的流量图之后，还是准备了几种方法来分析一下！

一。网络问题

二。监控一下流量

三。查看系统日志

A：由于公司的所有资产都是我在维护和安装调试，服务器在安装的时候也没有对网卡设置太多。

关闭DHCP，改由静态ip

1000m的传输速度，全双工

公司网速下载大概800m，上传大概60m

由于不确定是不是网卡设置问题或者是被黑了，暂时放下

B：使用iftop来监控流量，发现这个货监控的是实时的流量，并不能查看某一个时间段的流量,并且在监控过程中，流量也没有特别大

如果要是记录实时日志，那个这日志也太大了，万一这一天的时间内没有流量正常怎么办？？

三。还是查看日志吧

在centos7中大部分日志默认放在/var/log中

/var/log/messages ---> 整体系统信息，其中也包含系统启动期间的日志。
/var/log/dmesg ---> 内核缓冲信息（kernel ring buffer）。用dmesg查看系统启动信息。
/var/log/auth.log ---> 系统授权信息，包括用户登录和使用的权限机制等。
/var/log/boot.log ---> 系统启动时的日志。
/var/log/daemon.log ---> 系统后台守护进程日志信息。
/var/log/dpkg.log ---> 安装或dpkg命令清除软件包的日志。
/var/log/kern.log ---> 内核产生的日志。
/var/log/lastlog ---> 记录所有用户的最近信息。用lastlog命令查看内容。
/var/log/maillog 或 /var/log/mail.log ---> 电子邮件服务器的日志信息。
/var/log/user.log ---> 记录所有等级用户信息的日志。
/var/log/alternatives.log ---> 更新替代信息都记录在这个文件中。
/var/log/btmp ---> 记录失败登录信息。使用last命令查看，例如:last -f /var/log/btmp | more。
/var/log/cups ---> 涉及所有打印信息的日志。
/var/log/anaconda.log ---> Linux系统安装信息。
/var/log/yum.log ---> 使用yum安装的软件包信息。
/var/log/cron ---> crond计划任务服务执行情况。
/var/log/secure ---> 系统安全日志、验证和授权信息。
/var/log/wtmp或/var/log/utmp ---> 登录信息。使用 w/who/finger/id/last/lastlog/ac 进行查看。

/var/log/faillog ---> 用户登录失败信息。

查询所有日志，在流量升高的时间段里面，没有任何进程能到百兆以上的上传下载速度。

再仔细思考和查看流量之后，发现这些服务器同处于一个集群，在同一时间内，几乎所有的流量都达到百兆以上。会不会是在集群内进行传输数据？？

后来在日志里面查看了一下发现hadoop集群会在下载完数据之后，会进行数据的整理，什么时候下载完，什么时候进行汇总。所以，流量异常升高的时间段也不尽相同。

记一次流量异常分析案例

猜你喜欢