在我博客的fork()函数(一)中提到:
一个进程调用fork()函数后,系统先给新的进程分配资源,例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中,只有少数值与原来的进程的值不同。
这篇就详细说明一下:
- 子进程“继承”父进程的变量,其虚拟地址总是一样的。注意:是虚拟地址而非真正的物理地址!!!
- 在fork时整个虚拟地址空间被复制,但是虚拟地址空间所对应的物理内存却没有复制。
- 实际的系统采用一种方式,总结而言是八个字:“写时复制、读时共享”
- 读时共享:是指原先的变量如果没有在父子进程中被修改,那么父子进程中的变量值、虚拟地址以及物理地址均相同。
- 写时复制:是指原先变量如果在某一进程中被修改,此时重新分配物理内存,那么父子进程中的变量值、物理地址均不相同。
例题:
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <iostream>
int main()
{
int x = 5;
pid_t pid = fork ();
if (0 == pid)
{
std::cout << "pid = " << pid << std::endl;
x = 6;
std::cout << "x = " << x << " &x = " << &x << std::endl;
}
else if (pid > 0)
{
std::cout << "pid = " << pid << std::endl;
x = 7;
std::cout << "x = " << x << " &x = " << &x << std::endl;
}
else
{
std::cerr << "Error" << std::endl;
}
exit (0);
}
那个一样的地址是线性地址,每个进程的相同的线性地址都可以映射到不同的物理地址上。在fork的时候,子进程从父进程了copy了task_struct结构,其中task_struct里的mm就是线性地址的使用情况,mm也会被copy给子进程,所以在fork之前声明的变量,在fork后在父进程和子进程里的线性地址是一样的。