操作系统学习笔记（一）进程与线程模型

操作系统学习笔记（一）进程与线程模型
进程可以说是操作系统最为核心的一个抽象，而线程可以认为是一种轻量级的进程，或者说一个进程内的多个迷你进程。

一、进程的模型

进程(process):进程是一个正在运行的程序的实例。对于一个单核的处理器，每个时刻只能运行一个程序，但在每一个时间段，它可能运行多个进程，这样就产生了并行的错觉。

从概念上说，每个进程拥有自己的虚拟CPU，好像它独占了CPU的使用权一样，虽然实际的CPU是不断切换的。进程的另外一大特性，是独立的虚拟地址空间。

进程的创建

有四种事件导致进程的创建：
（1）系统初始化。系统初始化会创建许多进程，如windows刚开机的时候。

（2）执行了正在运行的进程所调用的系统调用。如程序运行了一个fork()调用。

（3）用户请求创建一个进程。如命令行中输入./a.out。

（4）一个批处理作业的初始化。

进程的终止

进程是正在运行的程序的实例，一个程序是会运行完的，所以进程也有终止的时候：

（1）正常退出（自愿）。如程序正常结束。

（2）出错退出（自愿）。如编写一个程序，当错误时调用exit(num)。

（3）严重错误（非自愿）。

（4）被其他进程杀死（非自愿）。如另外一个进程调用了kill(pid)。

进程的层次结构

不同操作系统有不同的概念。Linux系统中区分父进程与子进程，windows系统则不区分。

进程的状态

进程有三种主要状态：

（1）运行态：正在CPU上运行的进程。

（2）就绪态：已经就绪但是还没有被调度程序选中。

（3）阻塞态：因为某种原因（如等待I/O完成）暂时无法执行，需要等待外部事件。

下面有一幅图画出了可能的转换关系。需要注意的是，阻塞态的进程必须先进入就绪态，等待处理器的调度。

进程的实现

进程的实现，相对于线程来说是比较确定的。操作系统内核维护一个进程表，也称为进程控制块（PCB）。进程表项为一个进程启动的必要信息，包括进程管理（寄存器，PC，PSW，调度信息，打开文件的状态等）、存储管理（代码段、数据段、堆栈段指针等）、文件管理（目录、PID等）信息。

当进程从运行态进入其他状态时，PCB保存着启动它的所有信息，当该进程再次被调度程序选中时，就要恢复这些信息。保存的步骤，包括：硬件压入PC等，把中断向量装入新的PC，然后通过汇编语言保存寄存器并设置新的堆栈，运行中断服务程序（通常为C），再通过调度程序选中一个进程，把它的运行信息载入寄存器以及PC等。

二、线程的模型

线程的使用，是因为进程创建、撤销、切换的代价很大，并且需要共享内存空间和数据，以及提高运行速度。一个例子是Web服务器，它如果采用进程的方式，那么一个页面请求被响应时，进程就进入了阻塞态，从而无法提供其他服务。而采用线程，可以使用一个线程接受请求，然后把请求分派给工作线程，实现同时响应，并且共享内存。

线程模型基于两个概念：资源分组处理与执行。线程的目的，是共享资源，并共同完成一个任务。

线程与进程非常类似，不过比进程轻量，原因在于：进程拥有独立的虚拟地址空间，而同一个进程中的线程，共享内存空间与资源。因此，线程只需要保存PC、寄存器、堆栈等，无需保存大量的文件、进程管理信息。线程之间也是没有保护并且平等的，因为它们共享了同样的资源，包括打开的文件、子进程等。

POSIX（portable operating system interface of UNIX）规定了UNIX系统的通用线程包pthread。

线程的实现

线程的实现，总的来说有两种：在用户空间中实现线程，以及在内核中实现线程。

用户空间中实现线程

这种情况下，内核是不知道线程存在的，调度单位是进程。因此，为了体现多线程的作用，就必须考虑阻塞的问题。

因为用户管理线程，所以每个进程都要有线程表，与进程表类似，不过记录的内容比较少。

用户级线程的优点有很多：

（1）可以在不支持线程的系统上运行。

（2）速度非常快，因为它不需要陷入内核，不需要上下文切换，也不需要cache刷新。

（3）可以允许每个进程定制自己的线程调度算法。

当然，因为内核不知道线程的存在，需要解决阻塞的问题，可以通过非阻塞系统调用，或者检查调用是否会阻塞（如select，包装器）。

另外，因为内核不知道线程的存在，进程内部没有时钟中断，所以线程必须主动让出CPU，不然其他线程无法抢占。

内核中实现线程

内核中实现线程，即在内核中维护一个线程表，而进程不维护。与用户空间中实现相比，优缺点基本是相反的。

内核中的实现，自然不需要非阻塞I/O，但是代价就是，线程的操作花销很大。

分类: 操作系统

操作系统学习笔记（一） 进程与线程模型

猜你喜欢

操作系统学习笔记（一）进程与线程模型