Linux僵尸进程

在linux系统中，当用ps命令观察进程的执行状态时，经常看到某些进程的状态栏为defunct，这就是所谓的“僵尸”进程。“僵尸”进程是一个早已死亡的进程，但在进程表（processs table）中仍占了一个位置（slot）。由于进程表的容量是有限的，所以，defunct进程不仅占用系统的内存资源，影响系统的性能，而且如果其数目太多，还会导致系统瘫痪。

一、僵尸进程的产生原因

我们知道，每个进程在进程表里都有一个进入点（entry），核心程序执行该进程时使用到的一切信息都存储在进入点。当用ps命令察看系统中的进程信息时，看到的就是进程表中的相关数据。

所以，当一个父进程以fork()系统调用建立一个新的子进程后，核心进程就会在进程表中给这个子进程分配一个进入点，然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。

而当这个子进程结束的时候（比如调用exit命令结束），其实他并没有真正的被销毁，而是留下一个称为僵尸进程（Zombie）的数据结构（系统调用exit的作用是使进程退出，但是也仅仅限于一个正常的进程变成了一个僵尸进程，并不能完全将其销毁）。此时原来进程表中的数据会被该进程的退出码（exit code）、执行时所用的CPU时间等数据所取代，这些数据会一直保留到系统将它传递给它的父进程为止。由此可见，defunct进程的出现时间是在子进程终止后，但是父进程尚未读取这些数据之前。

此时，该僵尸子进程已经放弃了几乎所有的内存空间，没有任何可执行代码，也不能被调度，仅仅在进程列表中保留一个位置，记载该进程的退出状态信息供其他进程收集，除此之外，僵尸进程不再占有任何存储空间。他需要他的父进程来为他收尸，如果他的父进程没有安装SIGCHLD信号处理函数调用wait 或 waitpid() 等待子进程结束，也没有显式忽略该信号，那么它就一直保持僵尸状态，如果这时候父进程结束了，那么init进程会自动接手这个子进程，为他收尸，他还是能被清除掉的。但是如果父进程是一个循环，不会结束，那么子进程就会一直保持僵尸状态，这就是系统中为什么有时候会有很多的僵尸进程。

二、如何杀死僵尸进程

如上可知，僵尸进程一旦出现之后，很难自己消亡，会一直存在下去，直至系统重启。虽然僵尸进程几乎不占系统资源，但是，这样下去，数量太多了之后，终究会给系统带来其他的影响。因此，如果一旦见到僵尸进程，我们就要将其杀掉。如何杀掉僵尸进程呢？

有同学可能会说，很简单嘛，直接使用kill命令就好啊。或者，实在不行，加一个-9的后缀（kill -9），肯定杀掉！

请注意：defunct状态下的僵尸进程是不能直接使用kill -9命令杀掉的，否则就不叫僵尸进程了。那么，该如何杀呢？

方法有二：

重启服务器电脑，这个是最简单，最易用的方法，但是如果你服务器电脑上运行有其他的程序，那么这个方法，代价很大。所以，尽量使用下面一种方法。
找到该defunct僵尸进程的父进程，将该进程的父进程杀掉，则此defunct进程将自动消失。

问题又来了，如何找到defunct僵尸进程的父进程呢？

很简单，一句命令就够了：ps -ef | grep defunct_process_pid。

三、如何预防僵尸进程

以上介绍的只是在发现了僵尸进程之后，如何去杀死它。那么，有同学可能会说了，这个是治标不治本的。真正的办法是，不让它产生，问题才能彻底解决。OK，那我们就来介绍一下，如何预防僵尸进程的产生。

在父进程创建子进程之前，就向系统申明自己并不会对这个子进程的exit动作进行任何关注行为，这样的话，子进程一旦退出后，系统就不会去等待父进程的操作，而是直接将该子进程的资源回收掉，也就不会出现僵尸进程了。具体的办法就是，在父进程的初始化函数中，调用这个函数：signal(SIGCHLD,SIG_IGN)；
如果上述语句没来得及调用，也有另外一个办法。那就是在创建完子进程后，用waitpid等待子进程返回，也能达到上述效果；
如果上述两个办法都不愿意采用，那还有一招：在父进程创建子进程的时候，连续调用两次fork()，而且使紧跟的子进程直接退出，使其孙子进程成为孤儿进程，从而init进程将代替父进程来接手，负责清除这个孤儿进程。于是，父进程就无需进行任何的清理行为，系统会自动处理；

本人在实际项目中的具体代码，参考如下：

/**************************************************************************************************
**  函数名称:  start_proc
**  功能描述:  启动进程开始运行
**  输入参数:  无
**  输出参数:  无
**  返回参数:  启动成功返回1，启动失败则返回0
**  注意事项:  这里要fork两次，利用系统孤儿进程的回收机制来处理。否则，会出现僵尸进程。具体做法是
**  注意事项:  利用一代子进程再产生二代子进程，同时将一代子进程结束掉，并在父进程中进行收尸处理
**************************************************************************************************/
int start_proc_by_name(const char* procname)
{
    pid_t first_pid, second_pid;
    char  filename[100];

    sprintf(filename, "%s%s", PROC_FILE_PATH, procname);

    printf("going to start proc by filename \"%s\"...\n", filename);

    if (access(filename, X_OK | F_OK) != 0) {                                  /* 确认文件属性是否正确 */
        printf("access filename \"%s\" fail!!!\n", filename);
        return 0;
    }

    first_pid = fork();                                                        /* 创建一代子进程 */

    if (first_pid < 0) {                                                       /* 一代子进程创建失败 */
        printf("fork 1st child_proc fail!!!\n");
        return 0;
    } else if (first_pid == 0) {                                               /* 创建成功，此处是一代子进程的代码 */
        printf("fork 1st child_proc success. this is 1st child_proc going to fork 2nd child_proc...\n");

        second_pid = fork();                                                   /* 创建二代孙进程 */

        if (second_pid < 0) {                                                  /* 二代孙进程创建失败 */
            printf("fork 2nd child_proc fail!!!\n");
            return 0;
        } else if (second_pid == 0) {                                          /* 创建成功，此处是二代孙进程的代码 */
            printf("fork 2nd child_proc success. this is 2nd child_proc running...\n");

            if (execl(filename, procname, (char *)NULL) != -1) {               /* 在子进程中执行该程序 */
                printf("2nd child_proc: execl proc \"%s\" success!\n", procname);
                return 1;                                                      /* 执行完毕直接退出 */
            } else {
                printf("2nd child_proc: execl proc \"%s\" fail!\n", procname);
                return 0;
            }
        } else {                                                               /* 创建成功，此处是一代子进程的代码 */
            printf("fork 2nd child_proc success. 1st child_proc exiting...\n");
            sleep(1);
            exit(1);
        }
    } else {                                                                   /* 创建成功，此处是父进程的代码 */
        printf("fork 1st child_proc success. father_proc continue to run...\n");

        if (waitpid(first_pid, NULL, 0) != first_pid) {                        /* 父进程必须为一代子进程收尸 */
            printf("fork 1st child_proc success. 1st child_proc killed...\n");
        }
    }

    return 1;
}

  
  
   
   1
   
   2
   
   3
   
   4
   
   5
   
   6
   
   7
   
   8
   
   9
   
   10
   
   11
   
   12
   
   13
   
   14
   
   15
   
   16
   
   17
   
   18
   
   19
   
   20
   
   21
   
   22
   
   23
   
   24
   
   25
   
   26
   
   27
   
   28
   
   29
   
   30
   
   31
   
   32
   
   33
   
   34
   
   35
   
   36
   
   37
   
   38
   
   39
   
   40
   
   41
   
   42
   
   43
   
   44
   
   45
   
   46
   
   47
   
   48
   
   49
   
   50
   
   51
   
   52
   
   53
   
   54
   
   55
   
   56
   
   57
   
   58
   
   59
   
   60
   
   61
   
   62

怎么样，很简单吧？不妨去试试吧……

猜你喜欢