从C语言的内存模型研究python的内存模型

C语言的内存模型

背景

因为Python底层实际上是由C语言实现的,因此C语言的内存模型实际上对python的内存模型有很大的影响。

C语言的内存分区及说明

内存分区 说明
程序代码区(code area) 存放函数体的二进制码
静态数据区(data area) 也称全局数据区,包含的数据类型比较多,如全局变量、静态变量、一般常量、字符串常量。其中:
全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域, 未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。
常量数据(一般常量、字符串常量)存放在另一个区域。
注意:静态数据区的内存在程序结束后由操作系统释放。
堆区(heap area) 一般由程序员分配和释放,若程序员不释放,程序运行结束时由操作系统回收。malloc()calloc()free() 等函数操作的就是这块内存。
注意:这里所说的堆区与数据结构中的堆不是一个概念,堆区的分配方式倒是类似于链表。
栈区(stack area) 由系统自动分配释放,存放函数的参数值、局部变量的值等。其操作方式类似于数据结构中的栈。
命令行参数区 存放命令行参数和环境变量的值,如通过main()函数传递的值。
内存低地址 说明
.text① 代码区(code section)。由编译器链接器生成的可执行指令,程序执行时由加载器(loader)从可执行文件拷贝到内存中。为了安全考虑,防止别的区域更改代码区数据(即可执行指令),代码区具有只读属性。另一个方面,代码区通常具有可共享性(sharable),即在内存中只有一份代码区,如编译器,假如同时有多个编译任务在执行,这些编译任务会共享编译器的代码区,但同时各个编译任务又有自己独立的区域。
.rodata② 只读数据区(read-only section)。包含:只读全局变量,只读字符串变量,只读静态(static)变量。程序执行时由加载器(loader)从可执行文件拷贝到内存中。
.data③ 可写数据区(RW section)。包括:可写全局变量,可写静态(static)变量。程序执行时由加载器(loader)从可执行文件拷贝到内存中。
.bss④ 未初始化数据区(un-initialized section)。包括:未初始化或初始化为零的全局变量,未初始化或初始化为零的静态(static)变量。为了减小可执行文件的大小,在可执行文件中bss区只是一个占位符。在程序执行时,加载器(loader)根据bss区的大小,在内存中开辟相应空间,同时将这些内存空间全部初始化为零。
heap⑤ 堆区。对于C语言而言,heap指程序运行时(run-time)由malloc, calloc, realloc等函数分配的内存。
可扩展区  
stack⑥ 栈区。每一次函数调用,都会发生一次压栈操作,被压栈数据称为一个栈帧(stack frame),有多少次函数调用(包括main()函数),栈区就有多少个栈帧。相应的,每一次函数调用返回,都会相应的发生一次出栈操作,栈帧就会减少一个。
函数调用时,根据压栈的顺序,依次需要压栈的数据包括:调用函数(caller funtion)的上下文环境(context environment),如寄存器;函数返回地址;被调用函数(called funtion)的参数列表;被调用函数的非静态(static)局部变量。
当栈区溢出(stack overflow/underflow)时,栈区数据被污染,程序执行错误,甚至“跑飞”(函数返回地址被修改)。
cmd-line arguments and env variables⑦  
内存高地址

提示:关于局部的字符串常量是存放在全局的常量区还是栈区,不同的编译器有不同的实现,VC 将局部常量像局部变量一样对待,存储于栈(⑥区)中,TC则存储在静态数据区的常量区(②区)。

注意:未初始化的全局变量的默认值是 0,而未初始化的局部变量的值却是垃圾值(任意值)。

看一段代码:


#include<stdio.h>
#include<stdlib.h>
#include<string.h>
int a = 0;  // 全局初始化区(④区)
char *p1;  // 全局未初始化区(③区)
int main()
{
    int b;  // 栈区
    char s[] = "abc";  // 栈区
    char *p2;  // 栈区
    char *p3 = "123456"; // 123456\0 在常量区(②),p3在栈上,体会与 char s[]="abc"; 的不同
    static int c = 0;  // 全局初始化区
    p1 = (char *)malloc(10),  // 堆区
    p2 = (char *)malloc(20);  // 堆区
    // 123456\0 放在常量区,但编译器可能会将它与p3所指向的"123456"优化成一个地方
    strcpy(p1, "123456");
}

本文为读后的的简化和转载,原文地址:C语言内存模型

猜你喜欢

转载自blog.csdn.net/u010748502/article/details/81054889