数据库故障排查学习笔记(一)--sar指令超详解

(一)Sar指令学习笔记

 

sarSystem Activity Reporter(系统活动情况报告)的缩写。sar工具可以对系统当前的状态进行取样,获取当前运行状态。

它的特点是可以连续对系统取样,获得大量的取样数据;取样数据和分析的结果都可以存入文件,所需的负载很小。sar是目前Linux上最为全面的系统性能分析工具之一,可以从多个方面对系统的活动进行报告,包括文件的读写情况、系统调用的使用情况、串口、CPU效率、内存使用状况、进程活动及IPC有关的活动等。

这里主要介绍两种用法,并列出具体例子:

首先sar命令的格式如下:

sar [ options ] [ <interval> [ <count> ] ]

options可选择:-u-b-r等等很多,这里不详细列出,感兴趣的朋友可以在linux中输入指令sar /?,会展示出来可行options

[ <interval> [ <count> ] ]我以一个例子讲解:sar –W 1 2,在这个指令中,后边的1代表每隔1s获取一次信息,2表示一种获取两次,如果我们想要每5s获取一次,一共获取10次信息,那么指令就应该是sar –W 5 10

  1. 查看CPU使用率

sar -u : 默认情况下显示的是CPU使用率等信息

执行sar –u 1 2后:

 

 

  • %user 用户模式下消耗的CPU时间的比例;
  • %nice 通过nice改变了进程调度优先级的进程,在用户模式下消耗的CPU时间的比例
  • %system 系统模式下消耗的CPU时间的比例;
  • %iowait CPU等待磁盘I/O导致空闲状态消耗的时间比例;
  • %steal 利用Xen等操作系统虚拟化技术,等待其它虚拟CPU计算占用的时间比例;
  • %idle CPU空闲时间比例;

CPUall指所有CPU,我们还可以单独看每个CPU的使用,下边会展示:

各个CPU使用统计(-P)“-P ALL”选项指示对每个内核输出统计信息

执行命令:sar –P ALL 1 1

 

可以看到每个CPU的情况。

 

  1. 查看平均负载

sar -q: 查看平均负载

指定-q后,就能查看运行队列中的进程数、系统上的进程大小、平均负载等;与其它命令相比,它能查看各项指标随时间变化的情况;

执行sar –q 1 1

 

  • runq-sz:运行队列的长度(等待运行的进程数)
  • plist-sz:进程列表中进程(processes)和线程(threads)的数量
  • ldavg-1:最后1分钟的系统平均负载
  • ldavg-5:过去5分钟的系统平均负载
  • ldavg-15:过去15分钟的系统平均负载
  1. 查看内存使用

sar -r 指定-r之后,可查看物理内存使用状况;

执行sar –r 1 1后:

 

 

  • kbmemfree:这个值和free命令中的free值基本一致,表示可用空间不包括buffercache的空间.
  • kbmemused:这个值和free命令中的used值基本一致,所以它表示包括buffercache的空间的已用空间
  • %memused:物理内存使用率,这个值是kbmemused和内存总量(不包括swap)的一个百分比.
  • kbbufferskbcached:这两个值就是free命令中的buffercache.
  • kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).
  • %commit:这个值是kbcommit与内存总量(包括swap)的一个百分比.

 

 

 

4.整体I/O情况

使用-b选项,可以显示磁盘I/O的使用情况

执行指令sar –b 1 1后:

 

 

  • tps: 每秒向磁盘设备请求数据的次数,包括读、写请求,为rtpswtps的和。出于效率考虑,每一次IO下发后并不是立即处理请求,而是将请求合并(merge),这里tps指请求合并后的请求计数。
  • rtps: 每秒向磁盘设备的读请求次数
  • wtps: 每秒向磁盘设备的写请求次数
  • bread: 每秒从磁盘读的bytes数量
  • bwrtn: 每秒向磁盘写的bytes数量

注:想分别查看各个磁盘I/O情况可以用指令sar -d -p 1 1

 
 
 

5.查看页面交换发生状况

sar -W:查看页面交换发生状况,页面发生交换时,服务器的吞吐量会大幅下降;服务器状况不良时,如果怀疑因为内存不足而导致了页面交换的发生,可以使用这个命令来确认是否发生了大量的交换。

执行指令sar –W 1 1

 

  • pswpin/s:每秒系统换入的交换页面(swap page)数量
  • pswpout/s:每秒系统换出的交换页面(swap page)数量

要判断系统瓶颈问题,有时需几个 sar 命令选项结合起来;

  • 怀疑CPU存在瓶颈,可用 sar -u sar -q 等来查看
  • 怀疑内存存在瓶颈,可用sar -Bsar -r sar -W 等来查看
  • 怀疑I/O存在瓶颈,可用 sar -bsar -u sar -d 等来查看

 

6.网络统计

使用-n选项可以对网络使用情况进行显示,-n后接关键词“DEV”可显示eth0eth1等网卡的信息:

执行sar -n DEV 1 1

 

 

 

  • IFACE: 网络接口名称
  • rxpck/s: 每秒收包的数量
  • txpck/s: 每秒发包的数量
  • rxkB/s: 每秒收的数据量(kB为单位)
  • txkB/s: 每秒发的数据量(kB为单位)

 

 

7.日志保存

使用-o选项,我们可以把sar统计信息保存到一个指定的文件,对于保存的日志,我们可以使用-f选项读取。

 

这里不写具体例子了,朋友自行尝试吧

 

 

附录:sar参数说明

 

  • -A 汇总所有的报告
  • -a 报告文件读写使用情况
  • -B 报告附加的缓存的使用情况
  • -b 报告缓存的使用情况
  • -c 报告系统调用的使用情况
  • -d 报告磁盘的使用情况
  • -g 报告串口的使用情况
  • -h 报告关于buffer使用的统计数据
  • -m 报告IPC消息队列和信号量的使用情况
  • -n 报告命名cache的使用情况
  • -p 报告调页活动的使用情况
  • -q 报告运行队列和交换队列的平均长度
  • -R 报告进程的活动情况
  • -r 报告没有使用的内存页面和硬盘块
  • -u 报告CPU的利用率
  • -v 报告进程、i节点、文件和锁表状态
  • -w 报告系统交换活动状况
  • -y 报告TTY设备活动状况

 

 

发布了11 篇原创文章 · 获赞 14 · 访问量 1569

猜你喜欢

转载自blog.csdn.net/qq_41685265/article/details/98790696