[grm@VM-8-12-centos lesson9]$ ls -la
total 28
drwxrwxr-x  2 grm grm 4096 Mar  8 23:01 .
drwx------ 18 grm grm 4096 Mar  8 22:57 ..
-rw-rw-r--  1 grm grm   64 Mar  8 22:59 Makefile
-rwxrwxr-x  1 grm grm 8304 Mar  8 23:01 mytest
-rw-rw-r--  1 grm grm   66 Mar  8 23:01 test.c
[grm@VM-8-12-centos lesson9]$ echo $?
0
[grm@VM-8-12-centos lesson9]$ ls -lz
ls: invalid option -- 'z'
Try 'ls --help' for more information.
[grm@VM-8-12-centos lesson9]$ echo $?
2

我们发现当我们使用正确的ls指令时，用echo $?返回的退出码是0，而输出错误的指令得到的退出码是2。

我们创建一个test.c:

  1 #include<stdio.h>
  2 #include<unistd.h>
  3 
  4 int main()
  5 {
  6 
  7   return 2;                                                                                                                            
  8 }

当我们这样运行时：

[grm@VM-8-12-centos lesson9]$ vim test.c
[grm@VM-8-12-centos lesson9]$ make
gcc -o mytest test.c
[grm@VM-8-12-centos lesson9]$ ./mytest
[grm@VM-8-12-centos lesson9]$ echo $?
2
[grm@VM-8-12-centos lesson9]$ echo $?
0

我们运行时第一次用$?得到的退出码与我们预估计的一样，但是当我们再次echo $?时却已经不是我们想要的结果了，这是因为$?只会保留最近的一次退出码。

当我们想要结束进程外除了用return我们还可以用exit来结束进程。但是除了exit，还提供了_exit函数，他们有什么区别吗？我们可以用代码来试试。

当我们使用exit时：

  1 #include<stdio.h>
  2 #include<stdlib.h>                                                                                                                      
  3 #include<unistd.h>
  4 
  5 int main()
  6 {
  7   printf("hello exit");
  8   exit(1);
  9   return 0;
 10 }

运行结果：

当我们使用_exit时：

  1 #include<stdio.h>
  2 #include<stdlib.h>                                                                                                                      
  3 #include<unistd.h>
  4 
  5 int main()
  6 {
  7   printf("hello exit");
  8   _exit(1);
  9   return 0;
 10 }

运行结果：

我们发现_exit是不会刷新行缓冲区的，但是exit是会的。

exit 最后也会调用 _exit, 但在调用 _exit 之前，还做了其他工作：

1. 执行用户通过 exit 或 _exit 定义的清理函数。

2. 关闭所有打开的流，所有的缓存数据均被写入

3. 调用 _exit

3 进程等待

3.1 进程等待必要性

之前讲过，子进程退出，父进程如果不管不顾，就可能造成‘僵尸进程’的问题，进而造成内存泄漏。进程一旦变成僵尸状态，那就刀枪不入，“杀人不眨眼”的kill -9 也无能为力，因为谁也没有办法杀死一个已经死去的进程。

父进程派给子进程的任务完成的如何，我们需要知道。如子进程运行完成，结果对还是不对，或者是否正常退出。

父进程通过进程等待的方式，回收子进程资源，获取子进程退出信息。

3.2 进程等待的方法

3.2.1 wait方法

#include<sys/types.h>

#include<sys/wait.h>

pid_t wait(int*status);

返回值：

成功返回被等待进程pid，失败返回-1。

参数：

输出型参数，获取子进程退出状态,不关心则可以设置成为NULL。

这个方法很简单，我就不试试了，重点是下面的waitpid这个方法。

3.2.2 waitpid方法

pid_ t waitpid(pid_t pid, int *status, int options);

返回值：

当正常返回的时候waitpid返回收集到的子进程的进程ID；

如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0；

如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在；

参数：

pid ：

Pid=-1,等待任一个子进程。与wait等效。

Pid>0.等待其进程ID与pid相等的子进程。

status:

WIFEXITED(status): 若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）

WEXITSTATUS(status): 若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）

options:

WNOHANG: 若pid指定的子进程没有结束，则waitpid()函数返回0，不予以等待。若正常结束，则返回该子进程的ID 。

我们来看看是怎么用的：

  1 #include<stdio.h>
  2 #include<stdlib.h>
  3 #include<unistd.h>
  4 #include<sys/types.h>
  5 #include<sys/wait.h>
  6 int main()
  7 {
  8   pid_t id=fork();
  9   if(id==0)
 10   {
 11     //child
 12     int cnt=5;
 13     while(cnt--)
 14     {
 15       printf("我是一个子进程，我的pid:%d ,ppid:%d \n",getpid(),getppid());
 16       sleep(1);
 17     }
 18     exit(0);
 19   }
 20   //parent
 21   int status=0;                                                                                                                                            
 22   int ret_pid=waitpid(id,&status,0);
 23   printf("我是一个父进程，我的pid:%d\n",getpid());
 24   if(ret_pid<0)
 25   {
 26     printf("wait error\n");
 27   }
 28   else if(ret_pid>0)
 29   {
 30     printf("wait success\n");
 31   }
 32   return 0;
 33 }
~
~

我们来看看运行结果：

那父进程想要拿到子进程的状态应该怎么办呢?我们可以用status来获得。

当然用宏也能够得到，并且更加容易理解。下面我们这里用宏来获得：

  1 #include<stdio.h>
  2 #include<stdlib.h>
  3 #include<unistd.h>
  4 #include<sys/types.h>
  5 #include<sys/wait.h>
  6 int main()
  7 {
  8   pid_t id=fork();
  9   if(id==0)
 10   {
 11     //child
 12     int cnt=10;
 13     while(cnt)
 14     {
 15       printf("我是一个子进程，我还活着呢，cnt:%d，我的pid:%d ,ppid:%d \n",cnt--,getpid(),getppid());
 16       sleep(1);
 17     }
 18     exit(0);
 19   }
 20   //parent
 21   while(1)
 22   {
 23     int status=0;
 24     int ret_pid=waitpid(id,&status,WNOHANG);
 25     //bootprintf("我是一个父进程，我的pid:%d\n",getpid());
 26     if(ret_pid<0)                                                                                                                                          
 27     {
 28       printf("wait error\n");
 29       exit(1);
 30     }
 31     else if(ret_pid>0)
 32     {
 33       //printf("wait success\n");
 34       if(WIFEXITED(status))
 35       {
 36         printf("wait success 退出码为：%d\n",WEXITSTATUS(status));
 37      }
 38       else
 39       {
 40         printf("wait success 退出信号为：%d\n",status&0x7f);
 41       }
 42       break;
 43     }
 44     else 
 45     {
 46       printf("我是一个父进程，我再做其他的事情\n");
 47       sleep(1);
 48       continue;
 49     }
 50   } 
 51   return 0;
 52 }

当我们运行时：

假如我们想让父进程收到信号呢？我们可以用kill -9命令来杀掉子进程。

这样我们就得到了退出信号。

大家这时或许会疑问：这个WNOHANG又是什么鬼呢？

我们之前设置的默认参数为0，表示一种阻塞等待，就是父进程在等待子进程结束时不会去做其他的事情，而是专心等待，这里把参数设置成了WNOHANG就是不让其阻塞等待，而在等待子进程死亡时做一些其他的事情。平时我们说卡住了也喜欢说成HANG住了。

如果子进程已经退出，调用wait/waitpid时，wait/waitpid会立即返回，并且释放资源，获得子进程退出信息。

如果在任意时刻调用wait/waitpid，子进程存在且正常运行，则进程可能阻塞。

如果不存在该子进程，则立即出错返回。

3.3 获取子进程status

wait和waitpid，都有一个status参数，该参数是一个输出型参数，由操作系统填充。

如果传递NULL，表示不关心子进程的退出状态信息。否则，操作系统会根据该参数，将子进程的退出信息反馈给父进程。

status不能简单的当作整形来看待，可以当作位图来看待，具体细节如下图（只研究status低16比特位）

这个我们之前已经讲过了，获取终止信号用的是status&0x7f,获取退出状态可以用(status>>8)&0xff,也可以用上面我们讲到的宏(WEXITSTATUS)来处理。

但是在前面进程非阻塞代码那里我们只是用了一个打印语句来执行父进程在做其他的事情，如何写的更加真实漂亮一些呢？我们这里可以给出一些补充仅供参考：

  1 #include<stdio.h>
  2 #include<stdlib.h>
  3 #include<unistd.h>
  4 #include<sys/types.h>
  5 #include<sys/wait.h>
  6 //预设置一些任务
  7 #define TASK_NUM 10
  8 void sync_disk()
  9 {
 10   printf("这是一个数据刷新的任务\n");
 11 }
 12 
 13 void sync_log()
 14 {
 15   printf("这是一个同步日志的任务\n");
 16 }
 17 
 18 void net_sent()
 19 {
 20   printf("这是一个网络发送的任务\n");
 21 }
 22 
 23 typedef void (*fun)();                                                                                                  
 24 
 25 fun other_task[TASK_NUM]={NULL};
 26 
 27 int load_disk(fun f)
 28 {
 29   int i=0;
 30   for(;i<TASK_NUM;i++)
 31   {
 32     if(other_task[i]==NULL) break;
 33   }
 34   if(i==TASK_NUM) return -1;
 35   other_task[i]=f;
 36   return 0;                                                                                                             
 37 }
 38 
 39 void init_task()
 40 {
 41 
 42   int i=0;
 43   for(;i<TASK_NUM;i++) other_task[i]=NULL;
 44   load_disk(sync_log);
 45   load_disk(sync_disk);
 46   load_disk(net_sent);
 47 }
 48 
 49 void run_task()
 50 {
 51   int i=0;
 52   for(;i<TASK_NUM;i++)
 53   {
 54     if(other_task[i]==NULL) continue;                                                                                   
 55     else other_task[i]();
 56   }
 57 }
 58 int main()
 59 {
 60   pid_t id=fork();
 61   if(id==0)
 62   {
 63     //child
 64     int cnt=5;
 65     while(cnt)
 66     {
 67       printf("我是一个子进程，我还活着呢，cnt:%d，我的pid:%d ,ppid:%d \n",cnt--,getpid(),getppid());
 68       sleep(1);
 69     }
 70     exit(0);
 71   }
 72   //parent
 73   init_task();
 74   while(1)
 75   {
 76     int status=0;
 77     int ret_pid=waitpid(id,&status,WNOHANG);
 78     //bootprintf("我是一个父进程，我的pid:%d\n",getpid());
 79     if(ret_pid<0)
 80     {
 81       printf("wait error\n");                                                                                           
 82       exit(1);
 83     }
 84     else if(ret_pid>0)
 85     {
 86       //printf("wait success\n");
 87       if(WIFEXITED(status))
 88       {
 89         printf("wait success 退出码为：%d\n",WEXITSTATUS(status));
 90      }
 91       else
 92       {
 93         printf("wait success 退出信号为：%d\n",status&0x7f);
 94       }
 95       break;
 96     }
 97     else 
 98     {
 99       //printf("我是一个父进程，我再做其他的事情\n");
100       run_task();
101       sleep(1);
102       continue;
103     }
104   } 
105   return 0;
106 }

运行结果：

4 进程程序替换

4.1 替换原理

用 fork 创建子进程后执行的是和父进程相同的程序 ( 但有可能执行不同的代码分支 ), 子进程往往要调用一种 exec 函数以执行另一个程序。当进程调用一种 exec 函数时 , 该进程的用户空间代码和数据完全被新程序替换 , 从新程序的启动例程开始执行。调用 exec 并不创建新进程 , 所以调用 exec 前后该进程的 id 并未改变。

我们之前说过当fork之后父子进程的代码是共享的，数据会通过写时拷贝来进行处理，但是现在我们可以通过调用exec函数来帮助我们替换代码，话不多说，我们先来简单的认识一下：

  1 #include<stdio.h>
  2 #include<unistd.h>
  3 
  4 int main()
  5 {
  6   printf("begin:       !!!\n");
  7   printf("begin:       !!!\n");
  8   printf("begin:       !!!\n");
  9   printf("begin:       !!!\n");
 10   printf("我是一个进程：pid():%d\n",getpid());
 11   execl("/bin/ls","ls","-l","-a",NULL);                                                                                 
 12   printf("end:         !!!\n");
 13   printf("end:         !!!\n");
 14   printf("end:         !!!\n");
 15   printf("end:         !!!\n");
 16   return 0;
 17 }

我们运行一下：

不难发现程序中有begin，但是很奇怪没有end,这就是因为程序代码在execl之后就被替换了，所以后面的代码根本就不会执行。

4.2 替换函数

像与execl这种函数类似的还有另外的几个，我们一个一个来看：

#include <unistd.h>

int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);

首先来介绍第一个函数execl,第一个参数是路径，就是我们要执行的进程的绝对路径，后面的参数我们之前在命令行上怎样敲的命令就用""将我们的命令分割出来，最后在用NULL结束；

第4个函数execv,第一个参数与execl一样，写出该进程的绝对路径，第二个参数是一个指针数组类型，我们将在命令行上写的命令放在该数组中就行。

我们再来看看第二个函数execlp,第一个参数是执行进程的名称，ps(这里不需要写绝对路径，由于系统会自动在环境变量PATH中查找),第二个参数与execl第二个参数一样。

再来看看第三个函数execle,在讲这个函数之前我们试试能否用一个程序调用另外一个程序：

我们创建一个c++文件：

  1 #include<iostream>                                                                                                      
  2 #include<unistd.h>
  3 #include<stdlib.h>
  4 using namespace std;
  5 
  6 int main()
  7 {
  8   cout<<"我是另一个程序，我的pid是："<<getpid()<<endl;
  9   cout<<"MYENV: "<<(getenv("MYENV")==NULL?"NULL":getenv("MYENV"))<<endl;
 10 
 11   return 0;
 12 }

当我们运行时：

可是当我们在test.c中调用该程序时：

可见环境变量已经继承给子进程了。

test.c:

  #include<stdio.h>
  #include<stdlib.h>
  #include<unistd.h>
  #include<sys/types.h>
  #include<sys/wait.h>
  
  int main()
  {
    extern char** environ;
    pid_t id=fork();
    if(id==0)
    {
      //child
      printf("我是子进程，我的pid为：%d\n",getpid());
      char* const myenv[]={
        "MYENV=YouCanSeeMe",
        NULL
      };
      execle("../enc/other","other",NULL,myenv);
      exit(1);
    }
  
    //parent
    printf("我是父进程，我的pid是：%d\n",getpid());                                                                                                            
    int status=0;
    pid_t pid=waitpid(id,&status,0);
    if(pid<0)
    {
      printf("wait error\n");
    }
    else
    {
      if(WIFEXITED(status))
      {
        printf("wait success,exit code:%d\n",WEXITSTATUS(status));
      }
      else{
        printf("wait success,singal:%d\n",status&0x7f);
      }
   }
    return 0;
  }

但是当我们修改other.cc代码：

    1 #include<iostream>
    2 #include<unistd.h>
    3 #include<stdlib.h>
    4 using namespace std;
    5 
    6 int main()
    7 {
    8   cout<<"我是另一个程序，我的pid是："<<getpid()<<endl;
    9   cout<<"MYENV: "<<(getenv("MYENV")==NULL?"NULL":getenv("MYENV"))<<endl;
E> 10   cout<<"PATH: "<<(getenv("PATH")==NULL?"NULL":getenv("PATH"))<<endl;                                                  
   11   return 0;
   12 }

我们发现当我们用test.c调用other.cc程序时添加的环境变量居然把PATH给覆盖了。有什么方法可以解决吗？

答案是有的，我们在test.c中可以通过putenv函数将环境变量导入到environ中，我们使用environ将环境变量传给被调用的程序。

test.c:

  #include<stdio.h>
  #include<stdlib.h>
  #include<unistd.h>
  #include<sys/types.h>
  #include<sys/wait.h>
  
  int main()
  {
    extern char** environ;
    pid_t id=fork();
    if(id==0)
    {
      //child
      printf("我是子进程，我的pid为：%d\n",getpid());
     /* char* const myenv[]={
        "MYENV=YouCanSeeMe",
        NULL
      };*/
      putenv("MYENV=YouCanSeeMe");
      execle("../enc/other","other",NULL,environ);
      exit(1);
    }
  
    //parent                                                                                                                                                   
    printf("我是父进程，我的pid是：%d\n",getpid());
    int status=0;
    pid_t pid=waitpid(id,&status,0);
    if(pid<0)
    {
      printf("wait error\n");
    }
    else
    {
      if(WIFEXITED(status))
      {
        printf("wait success,exit code:%d\n",WEXITSTATUS(status));
      }
      else{
        printf("wait success,singal:%d\n",status&0x7f);
      }
    }
    return 0;
  }

当我们运行时：

我们通过上面的栗子来思考下为什么环境变量具有全局属性（子进程为什么会继承父进程的环境变量），也就是我们究竟是通过什么方式办到的？

相信大家此时已经有了答案，我们是通过exec函数将环境变量通过参数传递过去的。

那我们再思考一下，我们在test.c中不通过putenv来获得设置变量，而是在命令行上通过export来导入环境变量，这样可行吗？

我们分析分析，当我们export导入环境变量是导入在bash中的，而bash是我们创建的test.c的父进程，而子进程会继承父进程的环境变量，所以bash就将它的环境变量传递给了它的孙子进程，故是可以的，我们来验证验证：

结果与我们预想的一样。（ps:此时在test.c中我们是屏蔽了putenv的)

4.3 函数解释

这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。

如果调用出错则返回-1

所以exec函数只有出错的返回值而没有成功的返回值。

4.4 命名理解

l(list) : 表示参数采用列表

v(vector) : 参数用数组

p(path) : 有p自动搜索环境变量PATH

e(env) : 表示自己维护环境变量

函数名	参数格式	是否带路径	是否使用当前环境变量
execl	列表	否	是
execlp	列表	是	是
execv	数组	否	是
execvp	数组	是	是
execle	列表	否	否，需要自己组装环境变量
execve	数组	否	否，需要自己组装环境变量

表格中需要大家注意的是：是否带路径表示的是能不能去环境变量PATH中找，若带了路径，说明在环境变量中能够找到就不需要写出绝对路径，只写要执行文件的名字就好了，若没有带路径则说明需要自己补全路径来找寻该文件的位置。

事实上 , 只有 execve 是真正的系统调用 , 其它五个函数最终都调用 execve, 所以 execve 在 man 手册第 2 节 , 其它函数在man 手册第 3 节，其他的函数都是execve的封装。

【Linux系统：进程控制】

1 进程创建

1.1 fork函数

1.2 写时拷贝

1.3 fork常规用法

1.4 fork调用失败的原因

2 进程终止

2.1 进程退出场景

2.2 进程常见退出方法

3 进程等待

3.1 进程等待必要性

3.2 进程等待的方法

3.2.1 wait方法

3.2.2 waitpid方法

3.3 获取子进程status

4 进程程序替换

4.1 替换原理

4.2 替换函数

4.3 函数解释

4.4 命名理解

猜你喜欢