基于C，进一步研究 linux内核函数，系统级别的函数

2017年8月

1. 知识了解

1.1 基本概念：

（1）程序 program
被存放在磁盘中的可执行文件。
（2）进程 process
是程序的执行实例。每个进程具有独立的权限和职责，运行在各自的虚拟地址空间中。
进程之间不会相互影响，但可以进行通信。
（3）进程ID，process ID简称PID
非负整数，进程的数字标识符。
进程任务队列

1.2 启动例程

（1）“启动例程”被编译在main之前运行。
（2）收集命令行的参数，传递给main中的argc，argv。以及环境表envp。
（3）登记“终止函数”atexit()。

1.3 进程的终止

（1）正常终止

从main函数返回（return）
调用exit（标准C库函数）
调用_exit或_Exit（系统调用）
最后一个线程从“启动例程”返回
最后一个线程调用pthread_exit

注意：
return和exit()，会刷新标准IO缓存，会自动调用终止函数。
_exit()和_Exit(),不刷新，也不调用。

（2）异常终止

调用abort
接收一个信号并终止
最后一个线程对“取消”请求做出响应

（3）进程返回

通常程序成功返回0，否则返回非0
在shell中，可以产看进程返回值（echo $?）

（4）终止函数

#include <stdio.h>
int atexit(void (*function)(void));
向内核登记终止函数，成功返回0，否则-1

每个启动的进程都默认登记一个标准的终止函数
终止函数在进程终止时释放进程所占用的一些资源
登记多个终止函数，执行顺序以栈的方式执行，先登记后执行。

1.4 示意图

启动示意图

1.5 进程资源限制

linux中可用的资源resource如下：

RLIMIT_AS 			进程可用的存储区大小
RLIMIT_CORE 		core文件最大字节数
RLIMIT_CPU 			CPU时间最大值
RLIMIT_DATA			数据段最大长度
RLIMIT_FSIZE		可创建文件的最大长度
RLIMIT_LOCKS		文件锁的最大数
RLIMIT_MEMLOCK使用mlock能否在存储器中锁定的最长字节数
RLIMIT_NOFILE		能打开的最大文件数
RLIMIT_NPROC		每个用户ID可拥有的最大子进程数
RLIMIT_RSS			最大驻内存集的字节长度
RLIMIT_STACK		栈的最大长度

头文件

#include <sys/resource.h>

struct rlimit{
	rlim_t rlim_cur;/*软件限制：当前限制*/
	rlim_t rlim_max;/*硬件限制：当前限制可以达到的最大值*/
}

函数

（1）获取进程的资源限制，存放在rlptr指向 的结构体中。成功返回0，失败非0。
int getrlimit(int resource , struct rlimit *rlptr);

（2）修改resource指定的资源限制，通过rlptr指向的结构体。成功返回0
int setlimit(int resource,const struct rlimie *rlptr);

配置文件
（1）/etc/security/limits.conf
（2）linux中，进程资源的初始化由0号进程建立，并被后续进程继承。
资源限制的修改规则
（1）硬件资源限制必须大于等于软件限制。
（2）任何一进程可以降低或者提升其软件资源限制，但必须大于其软件限制。普通用户不可逆此操作。
（3）超级用户可以提高硬件限制。

2. 与进程有关的指令

2.1 PS指令

可以查看到：进程ID（PID），进程的用户ID，进程状态STAT，进程的command等等。

3. 进程常见状态

3.1 运行状态

系统当前的进程
就绪状态进程
PS命令的stat列 == R

3.2 等待状态

等待事件发生
等待系统资源
PS命令的stat列 == S

3.3 停止状态

PS命令的stat列 == T

3.4 僵尸状态

进程终止或结束
在进程表项中仍有记录
PS命令的stat列 == Z

3.5 进程状态的变换关系

进程状态变换关系

4. 进程的调度

4.1 一般性步骤

（1）处理内核中的工作
（2）处理当前进程
（3）选择进程（实时进程和普通进程）
（4）进程交换

4.2 task_struct中的调度信息

（1）策略

轮流策略
先进先出策略

（2）优先权

jiffies变量

（3）实时优先权

实时进程之间

（4）计数器

5. 进程标识

进程有很多的标识：
当前进程ID，实际用户ID，有效用户ID，用户组ID，父进程ID，进程组ID。
与此相关的函数：

头文件

#include <unistd.h>
#include <sys/types.h>

获取进程标识的函数

pid_t getpid(void);           //获取当前进程的ID标识
pid_t getppid(void);         //获取父进程的ID标识
pid_t getpgrp(void);        //获取当前进程所在的进程组ID标识。
pid_t getpgid(pid_t pid);  //获取指定ID的进程所在的进程组ID标识。

uid_t getuid(void);           //获取当前进程的 实际用户ID
uid_t geteuid(void);          //获取当前进程的 有效用户ID

gid_t getgid(void);           //获取当前进程的用户组ID

6. 进程的创建

本文的重点内容。

6.1 创建子进程的函数 fork

fork函数
fork创建的新进程被称为子进程。该函数被调用一次，会返回两次。
返回两次的区别：
（1）在父进程里，返回的是新子进程的进程ID。
（2）在新子进程里，返回的是0。因为子进程的数据段、堆、栈都是重新创建的。
（3）父和子进程的运行顺序，根据系统调度自动决定。
（4）子进程复制父进程的内存空间。
vfork函数
与fork类似，但是子进程先行运行，且不复制父进程的内存空间。
子进程的继承属性

用户信息和权限
目录信息，信号信息，环境，资源限制
共享存储段，堆，栈和数据段，共享代码段

子进程的特有属性

进程ID
锁信息
运行时间
未决信号

操作文件时内核结构变化

子进程继承文件描述表，不继承但共享文件表项和i-node。
创建一个子进程后，文件表项中的引用计数器加1变成2，当父进程作close操作后，计数器减1。子进程还是可以使用文件表项。只有当计数器为0时，才会释放文件表项。

6.2 进程寄生 exec函数簇

exec函数用于执行另一个程序。新执行的程序会替换原进程的正文，数据，堆，栈。
exec并不是创建新进程，前后的进程ID并没有改变。
在fork创建一个子进程之后，可以在子进程中使用exec函数执行另一个程序。

头文件

#include <unistd.h>

2.函数

//list 列出每个字符参数
int execl(const char *pathname,const char *arg0, ... /*(char*)0*/);
//argv 字符数组
int execv(const char *pathname,char * const argv[]);
//list 列出每个字符参数，环境表
int execle(const char *pathname,const char *arg0, ... /*(char*)0,char* const envp[]*/);
//argv 字符数组，环境表
int execve(const char *pathname,char * const argv[],char* const envp[]);
//
int execlp(const char *pathname,const char *arg0, ... /*(char*)0*/);
//
int execvp(const char *pathname,char * const argv[]);

上述所有的返回：出错返回-1 ，成功不返回。

6.3 system函数

system函数，内部构件一个子进程，由子进程调用exec函数。

头文件

#include <stdlib.h>