2019-2020-1 20199324《Linux内核原理与分析》第七周作业

第六章进程的描述和进程的创建

知识点总结

进程的描述

操作系统内核实现操作系统的三大管理功能以及对应的抽象概念：
- 进程管理（最核心）—— 进程
- 内存管理 —— 虚拟内存
- 文件系统 —— 文件
进程是怎样描述的？
- 通过进程控制块PCB描述进程
Linux内核中用数据结构 struct task_struct 来描述进程，称其为进程描述符。
进程描述符的结构示意图：
Linux内核管理的进程状态转化图：
注意：操作系统原理中就绪态和运行态这两个状态在Linux内核中都是相同的 TASK_RUNNING 状态。在Linux内核中，当进程是 TASK_RUNNING 状态时，它是可运行的，也就是就绪态，是否运行取决于它有没有获得CPU的控制权。
阻塞态也有两种：TASK_INTERRUPTIBLE 和 TASK_UNINTERRUPTIBLE 。
- TASK_INTERRUPTIBLE 状态是可以被信号和 wake_up() 唤醒的。
- TASK_UNINTERRUPTIBLE 状态只能被 wake_up() 唤醒的。
进程标识符PID。在进程描述符中用pid和tgid标识进程。
管理进程数据结构的双向链表：struct list_head tasks （是一个很关键的进程链表）

进程的创建

0号进程的初始化
0号进程 init_task 的初始化时通过硬件编码方式固定下来的。（其他的所有进程都是通过 do_fork 复制父进程的方式初始化的）

内存管理相关代码

1301  struct mm_struct *mm,*active_mm;

mm 和 active_mm 是和进程地址空间，内存管理相关的数据结构指针。

进程之间的父子、兄弟关系

进程描述符 struct task_struct 数据结构中记录了当前进程的父进程 real_parent；记录当前进程的子进程的是双向链表 struct list_head children；记录当前进程的兄弟进程的是双向链表 struct list_head sibling。

保存进程上下文中CPU相关的一些状态信息的数据结构

数据结构 struct thread_struct 用来保存进程上下文中CPU相关的一些状态信息的数据结构，在进程切换时起着很重要的作用。
struct thread_struct 数据结构中最关键的是 sp 和 ip：
- sp 用来保存进程上下文中ESP寄存器状态
- ip 用来保存进程上下文中EIP寄存器状态
  
  进程的创建过程分析
rest_init 通过 kernel_thread 创建两个内核线程：
- kernel_init （1号进程），是所有用户态进程的祖先。
- kthreadd 内核线程（2号进程），是所有内核线程的祖先，负责管理所有内核线程。
fork，vfork，clone 三个系统调用都可以创建一个新进程，而且都可通过调用 do_fork 来实现进程的创建。
fork 一个子进程的过程中，复制父进程的资源采用了Copy On Write（写时复制）技术。不需要修改进程资源，父子进程是共享内存存储空间的。
进程创建的过程：
- 复制进程的描述符，一一复制其他进程的资源（采用写时复制技术），分配子进程的内核堆栈并对内核堆栈关键信息进行初始化。
- Linux创建一个新的进程是从复制开始的，在系统内核里首先是将父进程的进程控制块PCB进行拷贝，然后再根据自己的情况修改相应的参数，获取自己的进程号，再开始执行。
进程创建过程中的重要函数或数据结构：
- do_fork()：主要完成调用 copy_process() 复制父进程信息、获得pid、调用 wake_up_new_task 将子进程加入调度器队列等待获得分配CPU资源运行、通过clone_flags标志做一些辅助工作。
- copy_process()：主要完成调用 dup_task_struct 复制当前进程（父进程）描述符 task_struct 、信息检查、初始化、把进程状态设置为 TASK_RUNNING （此时子进程置为就绪态）、采用写时复制技术逐一复制所有其他进程资源、调用 copy_thread 初始化子进程内核栈、设置子进程pid等。
- dup_task_struct()：复制当前进程（父进程）描述符 task_struct 和 copy_thread 初始化子进程内核栈，为子进程分配好内核栈。
- copy_thread()：完成内核栈关键信息的初始化。
- thread_info 结构：小型的进程描述符。通过task指针指向进程描述符。thread_info 结构由低地址到高地址增长。task_struct 结构中没有直接指向 thread_info 结构的指针，而是用一个 void 指针类型的成员表示，然后通过类型转换来访问 thread_info 结构。

通过实验跟踪分析进程创建的过程

删掉menu之后克隆一份新的，把test.c覆盖掉，在menu下面执行 make roofts 。

编译运行出来可以看到列表中增加了fork。下图是 MenuOS 的运行效果。执行fork可以看到父进程和子进程都输出信息。

启动gdb，把内核加载进来，连接到target remote 1234

在sys_clone、do_fork、dup_task_struct、copy_process、copy_thread、ret_from_fork处各设置断点。

继续执行，停到了 do_fork 位置，next

到 copy_process() 函数。继续执行

继续执行，到copy_thread：

涉及 system_call 的那段段汇编代码跟踪不到。

总结

1.在Linux中，fork()系统调用产生的子进程在系统调用处理过程中从何处开始执行？

从用户态空间来看，就是fork系统调用的下一条指令。

子进程和父进程都从调用fork函数的下一条语句开始执行

2.fork调用的特性“一次调用，两次返回”，它可能有三种不同的返回值：

1）在父进程中，fork返回新创建子进程的进程pid（返回值>0）；

2）在子进程中，fork返回0；

3）如果出现错误，fork返回一个负值。

创建新进程成功后，系统中出现两个基本完全相同的进程，这两个进程执行没有固定的先后顺序，哪个进程先执行要看系统的进程调度策略。此时，两个进程都从fork开始往下执行，只是pid不同。

3.父进程和新创建的子进程之间最大区别在于他们有着不同的PID。

4.所有的子进程是在do_fork实现创建和调用的。

5.对后面的跟踪状态还不太懂，等弄清楚了再进行补充。

参考资料：https://blog.csdn.net/zxm342698145/article/details/56513252
https://blog.csdn.net/Always2015/article/details/45008785?locationNum=9&fps=1