exit()与_exit()函数wait与waitpid及孤儿僵尸

注：exit()就是退出，传入的参数是程序退出时的状态码，0表示正常退出，其他表示非正常退出，一般都用-1或者1，标准C里有EXIT_SUCCESS和EXIT_FAILURE两个宏，用exit(EXIT_SUCCESS);可读性比较好一点。

作为系统调用而言，_exit和exit是一对孪生兄弟，它们究竟相似到什么程度，我们可以从Linux的源码中找到答案：

#define __NR__exit __NR_exit /* 摘自文件include/asm-i386/unistd.h第334行 */

"__NR_"是在Linux的源码中为每个系统调用加上的前缀，请注意第一个exit前有2条下划线，第二个exit前只有1条下划线。

这时随便一个懂得C语言并且头脑清醒的人都会说，_exit和exit没有任何区别，但我们还要讲一下这两者之间的区别，这种区别主要体现在它们在函数库中的定义。_exit在Linux函数库中的原型是：

＃include
void _exit(int status)

和exit比较一下，exit()函数定义在stdlib.h中，而_exit()定义在unistd.h中，从名字上看，stdlib.h似乎比 unistd.h高级一点，那么，它们之间到底有什么区别呢？

_exit()函数的作用最为简单：直接使进程停止运行，清除其使用的内存空间，并销毁其在内核中的各种数据结构；exit() 函数则在这些基础上作了一些包装，在执行退出之前加了若干道工序，也是因为这个原因，有些人认为exit已经不能算是纯粹的系统调用。

exit()函数与_exit()函数最大的区别就在于exit()函数在调用exit系统调用之前要检查文件的打开情况，把文件缓冲区中的内容写回文件，就是"清理I/O缓冲"。

exit()在结束调用它的进程之前，要进行如下步骤：

1.调用atexit()注册的函数（出口函数）；按ATEXIT注册时相反的顺序调用所有由它注册的函数,这使得我们可以指定在程序终止时执行自己的清理动作.例如,保存程序状态信息于某个文件,解开对共享数据库上的锁等.

2.cleanup()；关闭所有打开的流，这将导致写所有被缓冲的输出，删除用TMPFILE函数建立的所有临时文件.

3.最后调用_exit()函数终止进程。

_exit做3件事（man）：
1，Any open file descriptors belonging to the process are closed
2，any children of the process are inherited by process 1, init
3，the process's parent is sent a SIGCHLD signal

exit执行完清理工作后就调用_exit来终止进程。

此外，另外一种解释：

简单的说，exit函数将终止调用进程。在退出程序之前，所有文件关闭，缓冲输出内容将刷新定义，并调用所有已刷新的“出口函数”（由atexit定义）。

_exit:该函数是由Posix定义的，不会运行exit handler和signal handler，在UNIX系统中不会flush标准I/O流。

简单的说，_exit终止调用进程，但不关闭文件，不清除输出缓存，也不调用出口函数。

共同：

不管进程是如何终止的，内核都会关闭进程打开的所有file descriptors,释放进程使用的memory!

为何在一个fork的子进程分支中使用_exit函数而不使用exit函数？
‘exit()’与‘_exit()’有不少区别在使用‘fork()’，特别是‘vfork()’时变得很
突出。

‘exit()’与‘_exit()’的基本区别在于前一个调用实施与调用库里用户状态结构(user-mode constructs)有关的清除工作(clean-up)，而且调用用户自定义的清除程序 (自定义清除程序由atexit函数定义，可定义多次，并以倒序执行)，相对应，_exit函数只为进程实施内核清除工作。

在由‘fork()’创建的子进程分支里，正常情况下使用‘exit()’是不正确的，这是因为使用它会导致标准输入输出(stdio: Standard Input Output)的缓冲区被清空两次，而且临时文件被出乎意料的删除(临时文件由tmpfile函数创建在系统临时目录下，文件名由系统随机生成)。在C++程序中情况会更糟，因为静态目标(static objects)的析构函数(destructors)可以被错误地执行。

(还有一些特殊情况，比如守护程序，它们的父进程需要调用‘_exit()’而不是子进程；

适用于绝大多数情况的基本规则是，‘exit()’在每一次进入‘main’函数后只调用一次。)

在由‘vfork()’创建的子进程分支里，‘exit()’的使用将更加危险，因为它将影响父进程的状态。

#include        
#include        
int    glob = 6;               /* external variable in initialized data */
int main(void)
{
        int    var;            /* automatic variable on the stack */
        pid_t    pid;
 
        var = 88;
        printf("before vfork\n");       /* we don't flush stdio */
 
        if ( (pid = vfork()) < 0)
                printf("vfork error\n");
        else if (pid == 0) {            /* child */
                glob++;                                 /* modify parent's variables */
                var++;
               exit(0);                               /* child terminates */  //子进程中最好还是用_exit(0)比较安全。
        }
 
        /* parent */
        printf("pid = %d, glob = %d, var = %d\n", getpid(), glob, var);
        exit(0);
}

在Linux系统上运行，父进程printf的内容输出：pid = 29650, glob = 7, var = 89

子进程关闭的是自己的，虽然他们共享标准输入、标准输出、标准出错等 “打开的文件”，子进程exit时，也不过是递减一个引用计数，不可能关闭父进程的，所以父进程还是有输出的。

但在其它UNIX系统上，父进程可能没有输出，原因是子进程调用了e x i t，它刷新关闭了所有标准I / O流，这包括标准输出。虽然这是由子进程执行的，但却是在父进程的地址空间中进行的，所以所有受到影响的标准I/O FILE对象都是在父进程中的。当父进程调用p r i n t f时，标准输出已被关闭了，于是p r i n t f返回- 1。

在Linux的标准函数库中，有一套称作"高级I/O"的函数，我们熟知的printf()、fopen()、fread()、fwrite()都在此列，它们也被称作"缓冲I/O（buffered I/O）"，其特征是对应每一个打开的文件，在内存中都有一片缓冲区，每次读文件时，会多读出若干条记录，这样下次读文件时就可以直接从内存的缓冲区中读取，每次写文件的时候，也仅仅是写入内存中的缓冲区，等满足了一定的条件（达到一定数量，或遇到特定字符，如换行符和文件结束符EOF），再将缓冲区中的内容一次性写入文件，这样就大大增加了文件读写的速度，但也为我们编程带来了一点点麻烦。如果有一些数据，我们认为已经写入了文件，实际上因为没有满足特定的条件，它们还只是保存在缓冲区内，这时我们用_exit()函数直接将进程关闭，缓冲区中的数据就会丢失，反之，如果想保证数据的完整性，就一定要使用exit()函数。

Exit的函数声明在stdlib.h头文件中。

_exit的函数声明在unistd.h头文件当中。

下面的实例比较了这两个函数的区别。printf函数就是使用缓冲I/O的方式，该函数在遇到“\n”换行符时自动的从缓冲区中将记录读出。实例就是利用这个性质进行比较的。

exit.c源码

#include
#include
int main(void)
{
    printf("Using exit...\n");
    printf("This is the content in buffer");
    exit(0);
}

输出信息：

Using exit...

This is the content in buffer

#include
#include
int main(void)
{
    printf("Using exit...\n");   //如果此处不加“\n”的话，这条信息有可能也不会显示在终端上。
    printf("This is the content in buffer");
    _exit(0);
}

则只输出：

Using exit...

说明：在一个进程调用了exit之后，该进程并不会马上完全消失，而是留下一个称为僵尸进程（Zombie）的数据结构。僵尸进程是一种非常特殊的进程，它几乎已经放弃了所有的内存空间，没有任何可执行代码，也不能被调度，仅仅在进程列表中保留一个位置，记载该进程的退出状态等信息供其它进程收集，除此之外，僵尸进程不再占有任何内存空间。

#include ;

int main()
{
printf("%c", 'c');
_exit(0);
}

程序并没有输出"c", 说明_exit()没有进行io flush

#include <sys/types.h>

#include <sys/wait.h>

pid_t wait(int *status)

进程一旦调用了wait，就立即阻塞自己，由wait自动分析是否当前进程的某个子进程已经退出，如果让它找到了这样一个已经变成僵尸的子进程，wait就会收集这个子进程的信息，并把它彻底销毁后返回；如果没有找到这样一个子进程，wait就会一直阻塞在这里，直到有一个出现为止。

参数status用来保存被收集进程退出时的一些状态，它是一个指向int类型的指针。但如果我们对这个子进程是如何死掉的毫不在意，只想把这个僵尸进程消灭掉，我们就可以设定这个参数为NULL

pid = wait(NULL);//一般都是这样运用的

如果成功，wait会返回被收集的子进程的进程ID，如果调用进程没有子进程，调用就会失败，此时wait返回-1，同时errno被置为ECHILD。

所以，调用wait和waitpid不仅可以获得子进程的终止信息，还可以使父进程阻塞等待子进程终止，起到进程间同步的作用。如果参数status不是空指针，则子进程的终止信息通过这个参数传出，如果只是为了同步而不关心子进程的终止信息，可以将status参数指定为NULL。

#include <sys/wait.h>

pid_t wait(int *statloc);
pid_t waitpid(pid_t pid,int *statloc, int options);
//statloc指向终止进程的终止状态，如果不关心终止状态可指定为空指针
//pid有四种情况：
//1. pid == -1 等待任意子进程
//2. pid > 0 等待进程ID与pid相等的子进程
//3. pid == 0 等待组ID等于调用进程组ID的任意子进程
//4. pid < -1 等待组ID等于pid绝对值的任意子进程
//options控制waitpid的操作：
//1,2是支持作业控制
//1.WCONTINUED wcontinued
//2.WUNTRACED wuntraced
//3.WNOHANG waitpid不阻塞 wnohang

这两个函数区别如下：

//在子进程终止前，wait使其调用者阻塞，waitpid有一个选项可使调用者不阻塞。
//waitpid并不等待在其调用之后第一个终止的子进程，它有若干选项。换言之可以不阻塞。

//事实上：

pid_t wait(int *statloc)
{
return waitpid(-1, statloc, 0);
}

避免僵尸进程

当我们只fork()一次后，存在父进程和子进程。这时有两种方法来避免产生僵尸进程：

1.父进程调用waitpid()等函数来接收子进程退出状态。
2.父进程先结束，子进程则自动托管到Init进程（pid = 1）。

2、基本概念

　　我们知道在unix/linux中，正常情况下，子进程是通过父进程创建的，子进程在创建新的进程。子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程到底什么时候结束。当一个进程完成它的工作终止之后，它的父进程需要调用wait()或者waitpid()系统调用取得子进程的终止状态。

　　孤儿进程：一个父进程退出，而它的一个或多个子进程还在运行，那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养，并由init进程对它们完成状态收集工作。

　　僵尸进程：一个进程使用fork创建子进程，如果子进程退出，而父进程并没有调用wait或waitpid获取子进程的状态信息，那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死进程。

3、问题及危害

　　unix提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息，就可以得到。这种机制就是: 在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination status of the process,运行时间the amount of CPU time taken by the process等)。直到父进程通过wait / waitpid来取时才释放。但这样就导致了问题，如果进程不调用wait / waitpid的话， 那么保留的那段信息就不会释放，其进程号就会一直被占用，但是系统所能使用的进程号是有限的，如果大量的产生僵死进程，将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害，应当避免。

　　孤儿进程是没有父进程的进程，孤儿进程这个重任就落到了init进程身上，init进程就好像是一个民政局，专门负责处理孤儿进程的善后工作。每当出现一个孤儿进程的时候，内核就把孤儿进程的父进程设置为init，而init进程会循环地wait()它的已经退出的子进程。这样，当一个孤儿进程凄凉地结束了其生命周期的时候，init进程就会代表党和政府出面处理它的一切善后工作。因此孤儿进程并不会有什么危害。

　　任何一个子进程(init除外)在exit()之后，并非马上就消失掉，而是留下一个称为僵尸进程(Zombie)的数据结构，等待父进程处理。这是每个子进程在结束时都要经过的阶段。如果子进程在exit()之后，父进程没有来得及处理，这时用ps命令就能看到子进程的状态是“Z”。如果父进程能及时处理，可能用ps命令就来不及看到子进程的僵尸状态，但这并不等于子进程不经过僵尸状态。如果父进程在子进程结束之前退出，则子进程将由init接管。init将会以父进程的身份对僵尸状态的子进程进行处理。

　　僵尸进程危害场景：

　　例如有个进程，它定期的产生一个子进程，这个子进程需要做的事情很少，做完它该做的事情之后就退出了，因此这个子进程的生命周期很短，但是，父进程只管生成新的子进程，至于子进程退出之后的事情，则一概不闻不问，这样，系统运行上一段时间之后，系统中就会存在很多的僵死进程，倘若用ps命令查看的话，就会看到很多状态为Z的进程。严格地来说，僵死进程并不是问题的根源，罪魁祸首是产生出大量僵死进程的那个父进程。因此，当我们寻求如何消灭系统中大量的僵死进程时，答案就是把产生大量僵死进程的那个元凶枪毙掉（也就是通过kill发送SIGTERM或者SIGKILL信号啦）。枪毙了元凶进程之后，它产生的僵死进程就变成了孤儿进程，这些孤儿进程会被init进程接管，init进程会wait()这些孤儿进程，释放它们占用的系统进程表中的资源，这样，这些已经僵死的孤儿进程就能瞑目而去了。

exit()与_exit()函数wait与waitpid及孤儿僵尸

避免僵尸进程

猜你喜欢