【整合】【故障排查】LINUX系统资源使用情况排查(top、htop、ps、pstree)

 LINUX系统资源使用情况排查

     工作中我们常见的资源使用情况的排查包括,CPU使用情况、 内存使用情况、网络带宽使用情况等等。而我们常用的工具有top、htop、ps、pstree等等,htop--top加强版, pstree—ps加强版.

ps与top的却别与使用命令,参考:https://blog.csdn.net/timchen525/article/details/76364706


更多linux命令参考:runoob.com===>

     ====> TOP详解

top -   00:59:07 up 2 days,  6:06,  1 user,  load average: 1.32, 1.32, 1.27
Tasks:    75 total,   1 running,  74 sleeping,  0 stopped,  0 zombie
%Cpu(s):  0.3 us,  0.0 sy, 99.7 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  1882736 total,    84844 free,  1201756 used,   596136 buff/cache
KiB Swap:  1049596 total,  1049596 free,        0 used.   511944 avail Mem

top -   00:59:07 up 2 days,  6:06,  1 user,  load average: 1.32, 1.32, 1.27
当前系统时间 00:59:07  |  运行时间为2天6小时6分钟  |  当前登录用户为1个  |
1分钟、5分钟、15分钟的负载情况为1.32、1.32、1.27 
(一般观察5/15分钟的情况,服务器n核,那么负载情况切莫大于n,若接近n则值得注意,大于n则急需排查;)

Tasks(任务/进程):    75 total,   1 running,  74 sleeping,  0 stopped,  0 zombie
有75个进程  |  1个运行态  |  74个休眠态  |  0个停止态  |  0个僵尸态(僵尸进程)
(僵尸进程:父进程已经退出,而该进程dead之后没有进程接受,就成为僵尸进程.(zombie)进程)
(利用命令ps,可以看到有标记为Z的进程就是僵尸进程。)


%Cpu(s)(CPU):  0.3 us,  0.0 sy, 99.7 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
用户占用CPU-0.3  |  系统占用CPU-0.0  |   改变过优先级的进程占用CPU-99.7  |   空闲CPU-0.0  |  IO等待占用CPU-0.0  | 
硬中断占用CPU-0.0 软中断占用CPU-0.0   


KiB Mem(内存) :  1882736 total,    84844 free,  1201756 used,   596136 buff/cache
内存总量-1882736k  |  剩余-84844k  |  使用-1201756k  |   缓存总量-596136k


KiB Swap(交换分区):  1049596 total,  1049596 free,        0 used.   511944 avail Mem
总量-1049596k   |   空闲量...   |  使用量...  |   缓冲的交换区量...

      

PID        USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级,正值表示低优先级
VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
SHR — 共享内存大小,单位kb
S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计,单位1/100秒
COMMAND — 进程名称(命令名/命令行)

top使用格式

top [-] [d] [p] [q] [c] [C] [S] [s]  [n]

参数说明

d 指定每两次屏幕信息刷新之间的时间间隔。当然用户可以使用s交互命令来改变之。 
p 通过指定监控进程ID来仅仅监控某个进程的状态。 
q 该选项将使top没有任何延迟的进行刷新。如果调用程序有超级用户权限,那么top将以尽可能高的优先级运行。 
S 指定累计模式 
s 使top命令在安全模式中运行。这将去除交互命令所带来的潜在危险。 
i 使top不显示任何闲置或者僵死进程。 

c 显示整个命令行而不只是显示命令名 

更多请参考:【1】https://www.cnblogs.com/sunshuhai/p/6250514.html

                     【2】https://blog.csdn.net/dxl342/article/details/53507673/

====> PS 详解:

Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照,就是执行ps命令的那个时刻的那些进程,如果想要动态的显示进程信息,就可以使用top命令。

  要对进程进行监测和控制,首先必须要了解当前进程的情况,也就是需要查看当前进程,而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行和运行的状态、进程是否结束、进程有没有僵死、哪些进程占用了过多的资源等等。总之大部分信息都是可以通过执行该命令得到的。

  ps 为我们提供了进程的一次性的查看,它所提供的查看结果并不动态连续的;如果想对进程时间监控,应该用 top 工具。

  kill 命令用于杀死进程。

  linux上进程有5种状态: 

1. 运行(正在运行或在运行队列中等待) 

2. 中断(休眠中, 受阻, 在等待某个条件的形成或接受到信号) 

3. 不可中断(收到信号不唤醒和不可运行, 进程必须等待直到有中断发生) 

4. 僵死(进程已终止, 但进程描述符存在, 直到父进程调用wait4()系统调用后释放) 

5. 停止(进程收到SIGSTOP, SIGSTP, SIGTIN, SIGTOU信号后停止运行运行) 

ps工具标识进程的5种状态码: 

D 不可中断 uninterruptible sleep (usually IO) 

R 运行 runnable (on run queue) 

S 中断 sleeping 

T 停止 traced or stopped 

Z 僵死 a defunct (”zombie”) process 

1.命令格式:

  ps[参数]

2.命令功能:

  用来显示当前进程的状态

3.命令参数:

a  显示所有进程

-a 显示同一终端下的所有程序

-A 显示所有进程

c  显示进程的真实名称

-N 反向选择

-e 等于“-A”

e  显示环境变量

f  显示程序间的关系

-H 显示树状结构

r  显示当前终端的进程

T  显示当前终端的所有程序

u  指定用户的所有进程

-au 显示较详细的资讯

-aux 显示所有包含其他使用者的行程 

-C<命令> 列出指定命令的状况

--lines<行数> 每页显示的行数

--width<字符数> 每页显示的字符数

--help 显示帮助信息

--version 显示版本显示
 

实例参考:[2] https://www.cnblogs.com/shujuxiong/p/8983103.html

转载(摘取):

https://www.cnblogs.com/shujuxiong/p/8983103.html

https://blog.csdn.net/timchen525/article/details/76364706

https://www.cnblogs.com/sunshuhai/p/6250514.html

https://blog.csdn.net/dxl342/article/details/53507673/

猜你喜欢

转载自blog.csdn.net/GeeLoong/article/details/83451470