C程序编译过程

C语言一般用gcc进行编译,下面一个程序helloword.c:
#include<stdio.h>
#define BUF_SIZE 30
int main()
{
   char s[BUFSIZE]="hello,world!";
   printf("%s\n",s);
}
用gcc来生成可执行程序,命令为gcc helloword.c -o helloword,helloworld是可执行文件。
其中过程一般包括以下4个步骤:
-预处理
-编译
-汇编
-链接


gcc的选项有
   -o 输出可执行文件
   -c 编译生成目标文件
   -g 输出调试信息
   -O2 编译器优化级别  1-3
   -Wall 警告选项 输出警告信息
   -l 紧接着链接库 lpthread
   -L 指定链接库的路径
   -I 头文件路径
   -shared 编译成动态链接库


1.预处理
主要包括以下过程:
   -将#define删除,并展开所有的定义
   -处理所有的条件预编译指令,比如#ifdef,#endif等
   -处理#include预编译指令,将被包含的文件插入到该预编译指令的位置
   -删除所有的注释
   -添加行号和文件标识,以编译时产生调试用的行号及编译错误警告行号
   -保留所有的#pragma编译器指令,编译器需要使用它们


通常使用以下命令预处理

gcc -E helloworld.c -o helloworld.i
参数-E表示只进行预处理
也可以使用以下指令完成预处理过程
cpp helloworld.c > helloworld.i
用cat helloworld.i可以看到预处理后的代码


2.编译
编译过程就是把预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码
$gcc -S helloworld.c -o helloworld.s


3.汇编
汇编器将汇编代码转变成机器可以执行的命令,每一个汇编语句几乎都对应一条机器指令。汇编相对于编译过程比较简单,根据汇编指令和机器执行的对照表翻译即可。
$ gcc -c helloworld.c -o helloworld.o
注意helloworld.o文件内容为机器码。


4.链接
通过调用链接器ld来链接程序运行需要的一大堆目标文件,以及所依赖的其它库文件,最后生成可执行文件

总结
编译过程可分为6步:扫描(词法分析)、语法分析、语义分析、源代码优化、代码生成、目标代码优化。
词法分析:扫描器(Scanner)将源代的字符序列分割成一系列的记号(Token)。lex工具可实现词法扫描。
语法分析:语法分析器将记号(Token)产生语法树(Syntax Tree)。yacc工具可实现语法分析(yacc: Yet Another Compiler Compiler)。
语义分析:静态语义(在编译器可以确定的语义)、动态语义(只能在运行期才能确定的语义)。
源代码优化:源代码优化器(Source Code Optimizer),将整个语法书转化为中间代码(Intermediate Code)(中间代码是与目标机器和运行环境无关的)。中间代码使得编译器被分为前端和后端。编译器前端负责产生机器无关的中间代码;编译器后端将中间代码转化为目标机器代码。
目标代码生成:代码生成器(Code Generator).
目标代码优化:目标代码优化器(Target Code Optimizer)。


链接的主要内容是把各个模块之间相互引用的部分处理好,使得各个模块之间能够正确地衔接。

链接的主要过程包括:地址和空间分配(Address and Storage Allocation),符号决议(Symbol Resolution),重定位(Relocation)等。
链接分为静态链接和动态链接。
静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行文件会比较大。
而动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去。

猜你喜欢

转载自blog.csdn.net/GUI1259802368/article/details/79099714