僵尸进程(Zombie)

1.僵尸进程

进程完成工作后(执行完 main 函数中的程序后)应被销毁,但有时这些进程将变成僵尸进程,占用系统中的重要资源。这种状态下的进程称作“僵尸进程”,这也是给系统带来负担的原因之一。我们应该消灭这种进程。当然应掌握正确的方法,否则它会死灰复燃。

从下图可以看到,父进程的 PID 是 1166,子进程的 PID 是 1167

在这里插入图片描述

如果我们使用 kill -9 1167 命令将子进程干掉,观察父进程会收到什么信号?

从下图可以看到,父进程收到了 SIGCHLD 信号,子进程变成了僵尸进程。

在这里插入图片描述

在这里插入图片描述

在 Unix 系统中,一个子进程结束了,但是他的父进程还活着,但该父进程没有调用 wait()/waitpid() 函数来进行额外的处置,那么这个子进程就会变成一个僵尸进程。

僵尸进程已经被终止,不干活了,但是依旧没有被内核丢弃掉,因为内核认为父进程可能还需要该子进程的一些信息。作为开发者,坚决不允许僵尸进程的存在。

如何干掉僵尸进程?

  • 重启电脑。
  • 手动地把僵尸进程的父进程干掉,僵尸进程就会自动消失。
  • 一个进程被终止或者停止时,SIGCHLD 信号会被发送给父进程,所以,对于源码中有 fork() 行为的进程,我们应该拦截并处理 SIGCHLD 信号。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>

// 信号处理函数
void sig_usr(int signo)
{
    
    
    int status;

    switch (signo)
    {
    
    
        case SIGUSR1:
            printf("收到了SIGUSR1信号,进程id=%d!\n", getpid());    
            break;
        
        case SIGCHLD:
            printf("收到了SIGCHLD信号,进程id=%d!\n", getpid());

            // waitpid()函数获取子进程的终止状态,这样子进程就不会成为僵尸进程了
            // 第一个参数为-1,表示等待任何子进程
            // 第二个参数保存子进程的状态信息
            // 第三个参数提供额外选项,WNOHANG表示不要阻塞,让这个waitpid()立即返回
            pid_t pid = waitpid(-1, &status, WNOHANG);

            if (pid == 0) return; // 子进程没结束,会立即返回这个数字
            if (pid == -1) return; // 这表示这个waitpid()调用有错误,有错误也立即返回出去
            return; // 走到这里,表示成功,那也return吧
            break;
    }
}

int main(int argc, char* const* argv)
{
    
    
    pid_t pid;

    printf("进程开始执行!\n");

    // 系统函数,第一个参数是个信号,第二个参数是个函数指针,代表一个针对该信号的捕捉处理函数
    if (signal(SIGUSR1, sig_usr) == SIG_ERR)
    {
    
    
        printf("无法捕捉SIGUSR1信号!\n");
        exit(1);
    }

    if (signal(SIGCHLD, sig_usr) == SIG_ERR)
    {
    
    
        printf("无法捕捉SIGCHLD信号!\n");
        exit(1);
    }

    pid = fork(); // 创建一个子进程

    // 要判断子进程是否创建成功
    if (pid < 0)
    {
    
    
        printf("子进程创建失败,很遗憾!\n");
        exit(1);
    }

    // 现在父进程和子进程同时开始运行了 
    for (;;)
    {
    
    
        sleep(1);
        printf("休息1秒,进程id=%d!\n", getpid());
    }

    printf("再见了!\n");

    return 0;
}

在这里插入图片描述

2.产生僵尸进程的原因

向 exit 函数传递的参数值和 main 函数的 return 语句返回的值都会传递给操作系统。而操作系统不会销毁子进程,直到把这些值传递给产生该子进程的父进程。处在这种状态下的进程就是僵尸进程。也就是说,将子进程变成僵尸进程的正是操作系统。

问:此僵尸进程何时被销毁呢?

答:应该向创建子进程的父进程传递子进程的 exit 参数值或 return 语句的返回值。

问:如何向父进程传递这些值呢?

答:操作系统不会主动把这些值传递给父进程。只有父进程主动发起请求(函数调用)时,操作系统才会传递该值。换言之,如果父进程未主动要求获得子进程的结束状态值,操作系统将一直保存,并让子进程长时间处于僵尸进程状态。也就是说,父母要负责收回自己生的孩子。

接下来的示例将创建僵尸进程。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main(int argc, char *argv[])
{
    
    
	pid_t pid = fork();
	
	if (pid == 0)    // if Child Process
	{
    
    
		puts("Hi, I am a child process");
	}
	else
	{
    
    
		// 输出子进程ID。可以通过该值查看子进程状态(是否为僵尸进程)。
		printf("Child Process ID: %d\n", pid);
		
		// 父进程暂停30秒。如果父进程终止,处于僵尸状态的子进程将同时销毁。因此,延缓父进程的执行以验证僵尸进程。
		sleep(30);    // Sleep 30 sec.
	}

	if (pid == 0)
		puts("End child process");
	else
		puts("End parent process");
	
	return 0;
}

编译运行:

gcc zombie.c -o zombie
./zombie

在这里插入图片描述

程序开始运行后,将在如上所示状态暂停。跳出这种状态前(30秒内),应验证子进程是否为僵尸进程,该验证在其他控制台窗口进行。

在这里插入图片描述

可以看出,PID 为 1387 的进程状态为僵尸进程(Z+)。另外,经过 30 秒的等待时间后,PID 为 1386 的父进程和 PID 为 1387 的僵尸子进程同时销毁。

3.利用 wait 函数销毁僵尸进程

如前所述,为了销毁子进程,父进程应主动请求获取子进程的返回值。

#include <sys/wait.h>

pid_t wait(int *statloc);

// 成功时返回终止的子进程ID,失败时返回-1

调用此函数时如果已有子进程终止,那么子进程终止时传递的返回值(exit 函数的参数值、main 函数的 return 返回值)将保存到该函数的参数所指内存空间。但函数参数指向的单元中还包含其他信息,因此需要通过下列宏进行分离:

  • WIFEXITED:子进程正常终止时返回“真”(true)。
  • WEXITSTATUS:返回子进程的返回值。

也就是说,向 wait 函数传递变量 status 的地址时,调用 wait 函数后应编写如下代码:

if (WIFEXITED(status))    // 是正常终止的吗?
{
    
    
    puts("Normal termination!");
    printf("Child pass num: %d", WEXITSTATUS(status));    // 那么返回值是多少?
}

根据上述内容编写如下示例,在下面示例中,不会再让子进程变成僵尸进程。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main(int argc, char *argv[])
{
    
    
	int status;

	// 第11行创建的子进程将在第15行通过main函数中的return语句终止。
	pid_t pid = fork();
	
	if (pid == 0)
	{
    
    
		return 3;
	}
	else
	{
    
    
		printf("Child PID: %d\n", pid);

		// 第22行中创建的子进程将在第26行通过调用exit函数终止。
		pid = fork();
		
		if (pid == 0)
		{
    
    
			exit(7);
		}
		else
		{
    
    
			printf("Child PID: %d\n", pid);
			
			// 调用wait函数。之前终止的子进程相关信息将保存到status变量,同时相关子进程被完全销毁。
			wait(&status);

			// 第36行中通过WIFEXITED宏验证子进程是否正常终止。如果正常退出,则调用WEXITSTATUS宏输出子进程的返回值。
			if (WIFEXITED(status))
				printf("Child send one: %d\n", WEXITSTATUS(status));
			
			// 因为之前创建了2个进程,所以再次调用wait函数和宏。
			wait(&status);
			
			if (WIFEXITED(status))
				printf("Child send two: %d\n", WEXITSTATUS(status));
			
			// 为暂停父进程终止而插入的代码。此时可以查看子进程的状态。
			sleep(30); // Sleep 30 sec.
		}
	}

	return 0;
}

编译运行:

gcc wait.c -o wait
./wait

输出结果:

在这里插入图片描述

在这里插入图片描述

可以看出,此时系统中并没有 PID 为 1497 和 1498 的进程,这是因为调用了 wait 函数,完全销毁了该子进程。另外,两个子进程终止时返回的 3 3 3 7 7 7 传递到了父进程。

这就是通过调用 wait 函数消灭僵尸进程的方法。调用 wait 函数时,如果没有已终止的子进程,那么程序将阻塞(Blocking)直到有子进程终止,因此要谨慎调用该函数。

4.使用 waitpid 函数销毁僵尸进程

wait 函数会引起程序阻塞,还可以考虑调用 waitpid 函数。这是防止僵尸进程的第二种方法,也是防止阻塞的方法。

#include <sys/wait.h>

pid_t waitpid(pid_t pid, int *statloc, int options);

// 成功时返回终止的子进程ID(或0),失败时返回-1
// pid:等待终止的目标子进程的ID,若传递-1,则与wait函数相同,可以等待任意子进程终止
// statloc:与wait函数的statloc参数具有相同含义
// options:传递头文件sys/wait.h中声明的常量WNOHANG,即使没有终止的子进程也不会进入阻塞状态,而是返回0并退出函数

下面介绍调用 waitpid 函数的示例。调用 waitpid 函数时,程序不会阻塞。

#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>

int main(int argc, char *argv[])
{
    
    
	int status;
	pid_t pid = fork();
	
	if (pid == 0)
	{
    
    
		// 调用sleep函数推迟子进程的执行。这会导致程序延迟15秒。
		sleep(15);
		return 24;
	}
	else
	{
    
    
		// while循环中调用waitpid函数。向第三个参数传递WNOHANG,因此,若之前没有终止的子进程将返回0。
		while (!waitpid(-1, &status, WNOHANG))
		{
    
    
			sleep(3);
			puts("sleep 3sec.");
		}

		if (WIFEXITED(status))
			printf("Child send %d\n", WEXITSTATUS(status));
	}

	return 0;
}

编译运行:

gcc waitpid.c -o waitpid
./waitpid

输出结果:

在这里插入图片描述

可以看出,第 22 22 22 行共执行了 5 5 5 次。另外,这也证明 waitpid 函数并未阻塞。

猜你喜欢

转载自blog.csdn.net/qq_42815188/article/details/129392190