日常运维 (0413任务)

1. 使用w查看系统负载

linux 日常运维管理技巧

<1>  监控系统状态

w/uptime   查看系统负载:第一行从左到右显示的信息依次为:时间、系统运行时间、登录用户数、平均负载。

第二行依次是:当前登录的用户名及其登录的地址。

系统负载: 三个数字。分别表示,1分钟系统的平均负载值,5分钟系统的平均负载值,15分钟系统的平均负载值。

重点是看第一个值,表示单位时间内使用CPU的活动进程数(在这里其实就是1分钟内),值越大就说明服务器压力越大。这个值只要不超过服务器的CPU数量就没有关系。

cat/proc/cpuinfo  查看CPU核数。查看的是逻辑CPU,不是物理CPU。

如果是0,代表1颗CPU;如果是1,代表2颗CPU.

2 vmstat 监控系统的状态

使用方法:vmstat 1   表示每一秒钟,显示一次。

分为6个部分:procs、memory、swap、io、system和cpu

procs 显示进程的相关信息:

r(run)  表示运行或等待CPU时间片的进程数。

b(block) 表示等待资源的进程数,这个资源指的是I/O,内存等。

memory  显示内存的相关信息:

swpd: 表示切换到交换分区中的内存数量,单位为KB.

free: 表示当前空闲的内存数量,单位为KB。

buff: 表示(即将写入磁盘的)缓冲大小,单位为KB.

cache: 表示(从磁盘中读取的)缓冲大小,单位KB.

swap 显示内存的交换情况

si: 表示由交换区写入内存的数据量,单位为KB.

so:表示由内存写入交换区的数据量,单位为KB.

io 显示磁盘的使用情况

bi: 表示从块设备读取数据的量(读磁盘), 单位为kb.

bo: 表示从块设备写入数据的量(写磁盘), 单位为kb.

system: 显示采集间隔内发生的中断次数

in: 表示在某一时间间隔内观测到的每秒设备的中断次数。

cs:表示每秒产生的上下文切换次数。

cpu : 显示CPU的使用状态。

us: 显示用户下所花费CPU的时间百分比

sy:显示系统花费CPU的时间百分比

id: 表示CPU处于空闲状态的时间百分比.

wa: 表示I/O等待所占用CPU的时间百分比

st:表示被偷走的CPU所占百分比(一般为0,不用关注)

重点关注:r, b和wa这3列。

3. TOP 命令显示进程所占的系统资源

top命令用于动态监控进程所占的系统资源,每隔3秒一次。它的特点是把占用系统资源(cpu、内存、磁盘I/O)最高的进程放到最前面。

RES : 这一项为进程所占物理内存的大小。

%MEM% 为使用内存的百分比。

top  -c     可以查看到具体的命令。

4. 用sar 命令监控系统状态

sar 命令很强大,它可以监控系统几乎所有资源的状态,比如平均负载、网卡流量、磁盘状态、内存使用等。

与其他系统状态监控工具不同,它可以打印历史信息,可以显示当天从零点开始到当前时刻的系统状态信息。

使用前,需要安装 yum install  -y sysstat

首次安装会提示报错:那是因为如果SAR 后面不跟命令,它会调用保留的一个数据库文件,在/var/log/sa/目录下。这个目录就是放这个工具生成的信息的历史文件目录。因为SAR 有一个特性,会每隔10分钟把记录信息刷一遍,保存在这个目录里。

1. 查看网卡流量  sar -n  DEV

打印网卡信息,每隔1秒钟显示一次,显示10次。

IFACE 表示设备名称。

这一列表示每秒进入收取的包的数量。

这一列表示每秒发送出去的包的数量。

这一列表示每秒收取的数据量。

  这一列表示每秒发送的数据量。

加上-f 选项查看某一天的网卡流量历史,后面跟文件名。

查看系统的负载情况。

查看磁盘的读写流量情况。

5. 用nload 命令产看网卡流量

系统没有默认安装,需要进行安装,安装方法:

# yum install  -y epel-release ;  yum  install  -y  nload

SAR17 可以直接看到的文件。

6.监控IO性能

安装sysstat 时,就会安装IOSTAT,它和sar 是同一个包。

这个代表磁盘有多少时间占用CPU。如果这个数值非常大,说明磁盘太差了。

io有问题,可能是服务读写太快,也可能是磁盘有问题。 

遇到这种问题,肯定是要先分析原因,看看是磁盘问题,还是服务问题。如果是磁盘问题,肯定是要换磁盘。服务问题,就要看是异常还是正常,异常的话,就需要近一步分析异常的原因,正常的话,那就说明需要扩容了。

iotop  也需要安装。

动态显示IO作业情况

7. 用free 命令查看内存使用状况

free 命令可以查看当前系统的总内存大小以及使用内存的情况。

free 有三行,其中第一行是说明,第二行是内存情况,第三行是交换分区情况。

第一行说明:

total :  内存总大小

used: 真正使用的实际内存大小

free:  剩余物理内存大小(没有被分配,纯剩余)

shared:  共享内存大小,不用关注它。

buff/cache:  分配给buffer 和 cache 的内存总共有多大。

注意点:  buffer和cache 都是一部分内存,内存的作用就是缓解cpu和IO(如:磁盘)的速度差距的。数据经过CPU计算,即将要写入磁盘,这是用的内存为buffer;CPU 要计算时,需要把数据从磁盘中读出来,临时先放到内存中,这部分内存就是cache.

available :系统可使用内存有多大,它包含了free. available 是由free这部分内存和buffer/cache 还未被占用的那部分内存组成。

used 那部分内存和buffer/cache 被占用的内存是没有关系的。

available = buffer+cache+free

total =  used + free+buffer/cache

free 命令 可以加-m 和 -g (分别以MB和GB为单位)

8. PS命令查看系统进程。

终止(杀死)进程。可以采用KILL  PID 进程号。每一个进程都有一个目录。

直接影响系统的负载。

ps aux | grep -c  sshd  查看某个进程或者它的数量。

9.查看网络的状态

查看UDP和TCP状态情况

netstat -an  查看所有的状态。

10. 抓包工具: tcpdump

-nn 选项的作用"是让第3列和第4列显示成“IP+端口号”的形式,如果不加-nn选项,则显示"主机名+服务名称".

DDos  攻击命令。 接入专业的防攻击的设备。

可以指定抓包某个网卡的端口。

某台IP设备的22号端口的包。

指定包的数量和存放的文件地址。

安装wireshark 工具,使用tshark 命令。

这个命令类似于web 访问日志。

11. linux 网络相关

当网卡down 输入ifconfig 不显示。ifconfig  -a  输入就可以查看到

if down 即停用网卡,if  up 启动网卡。

如果在远程登录服务器,当使用ifdown ens33 的话,会导致无法再连接服务器。

这个时候应该使用ifdown ens33 && ifup ens33.停用之后马上启动。

但尽量使用这个命令: systemctl  restart  network 来重启网卡。

配置网络信息,需要修改配置文件: /etc/sysconfig/network-scripts/ifcfg-xxx

设置多种IP

设置虚拟网卡

查看网卡是否连接,网卡的连接状态。

更改主机名:完了之后重新登录,打一个bash 命令就可以了。

设置DNS。 只要把DNS地址写到配置文件/etc/resolv.conf 文件中。

如果只是临时修改DNS IP地址,直接修改/etc/resolv.conf ; 如果是永久修改,需要修改网卡的配置文件/etc/sysconfig/network-scripts/ifcfg-xxx.

临时解析某个域名。

只在本机生效。

注意点:一个IP后面可以跟多个域名,可以是几十个甚至上百个。

每一行只能有一个IP,也就是说一个域名不能对应多个IP。

如果有多行中出现相同的域名(对应的IP不一样),会按最前面出现的记录来解析

本次课题笔记资料:

  https://docs.qq.com/doc/DR3dISkdERGtac2VD

猜你喜欢

转载自blog.csdn.net/weixin_40876986/article/details/89282901
今日推荐