引言

当使用集成开发环境（IDE）进行C语言编程时，点击"编译"按钮后，整个C程序从源代码到可执行文件的生成过程会自动完成。IDE会在后台为我们执行C语言的编译过程，将源代码转换为最终的可执行文件。虽然IDE隐藏了底层的细节，但理解编译过程对于程序员来说仍然是很有价值的。

概括介绍

gcc和g++都是GNU编译器套件（GNU Compiler Collection，简称GCC）的一部分，其中gcc用于编译C语言代码，而g++用于编译C++语言代码。它们的编译过程在大部分情况下是类似的，但根据输入文件的扩展名和一些默认选项的不同，它们会调用不同的编译器前端，即C前端或C++前端。

下面是gcc和g++的编译过程的概述

预处理（Preprocessing）：首先，对源文件进行预处理。预处理器将处理源代码中的预处理指令，比如以#开头的指令，如#include、#define等，并展开宏定义。预处理后的代码会生成一个.i文件，通常是在临时目录中。
编译（Compiling）：接下来，编译器前端会将预处理后的源代码编译成汇编代码（.s文件）。此阶段会检查语法和语义错误，并进行优化，但不会生成可执行代码。
汇编（Assembling）：汇编器（as）将汇编代码转换成机器代码，并生成目标文件（.o文件）。
链接（Linking）：最后，链接器（ld）将目标文件与所需的库文件链接在一起，生成最终的可执行文件。

下面让我们在Linux环境下简单示例C程序编译过程加深理解

代码示例(main.c)：

#include<stdio.h>

int main(){
    printf("Hello Linux\n");
    return 0;
}

一、预处理

预处理是编译过程的第一步，它处理以#开头的预处理指令，并展开宏定义。预处理器会执行以下主要任务：

处理#include指令：将指定的头文件内容插入到源代码中。这样，可以在源文件中使用其他函数或变量的声明和定义。

处理宏定义：将代码中定义的宏展开为对应的表达式或语句。例如，#define MAX_VALUE 100将会在源代码中把所有MAX_VALUE替换为100。

处理条件编译指令：如#ifdef、#ifndef、#if等，这些指令根据条件判断是否编译部分代码块。

预处理后的代码会生成一个.i文件，这是一个展开了所有宏和包含了所有头文件的中间文件。

语法示例

gcc -E main.c -o main.i

命令中-E是让编译器在预处理之后就退出，不进行后续编译过程，-o是指定输出文件名。

使用该指令的结果是将stdio.h文件全部内容插入到main.c形成main.i文件。

可以看到预处理之后的main.i文件显然比main.c文件大得多。我们查看一下main.i文件，因为此时main.i依然是文本文件。

（使用head指令查看main.i文件）

二、编译

编译是预处理后代码的第二个阶段。编译器前端（例如cc1或cc1plus）接收预处理后的代码，并将其转换成汇编代码。在编译阶段，编译器执行以下主要任务：

语法和语义检查：编译器检查代码是否符合C/C++语法规则，并进行语义分析，以确保代码没有逻辑错误。

生成中间表示：编译器将代码转换成中间表示形式，通常是一种低级的、与特定硬件无关的表示。

优化：编译器可能对中间表示进行优化，以提高程序的执行效率和代码质量。

编译阶段不会生成可执行文件，而是将代码转换成汇编代码，通常保存为.s文件。

语法示例

gcc -S main.i -o main.s

命令中-S让编译器在编译之后停止，不进行后续编译过程，-o是指定输出文件名。

编译成汇编文件大小已经非常小了，相对于预处理之后的main.i文件小很多。

编译过程完成后，将生成程序的汇编代码test.s，这也是文本文件。我们查看一下。

图中即为main.s中的汇编代码。

三、汇编

在汇编阶段，汇编器（as）接收编译生成的汇编代码，并将其转换为机器代码。汇编器的任务包括：

将汇编代码转换为机器代码：将汇编代码中的汇编指令翻译成特定硬件架构能理解的机器指令。

生成目标文件：生成一个或多个目标文件（.o文件），每个文件对应一个源文件或编译单元。

目标文件是机器代码的二进制表示形式，但它们还不是最终可执行的程序，因为某些符号引用可能仍然未解析。

语法示例

gcc -c main.s -o main.o

命令中-c选项，它告诉gcc只进行编译，不进行链接。因此，这个命令只会将汇编代码转换为目标文件，而不会生成可执行文件。-o是指定输出文件名。

目标文件test.o是二进制表示的机器代码，可以作为链接的输入，用于生成最终的可执行文件。

四、链接

链接器接收一个或多个目标文件，以及所需的库文件，并将它们合并成最终的可执行文件。

链接器解析目标文件中的符号引用，找到对应的符号定义，并将符号重定位，以便正确地指向它们的定义。

合并库文件，生成完整的可执行文件，其中包含所有的机器代码和解析后的符号。

语法示例

gcc main.o -o main

命令gcc main.o -o main是将目标文件(main.o)链接为可执行文件(main)的gcc命令。在这个命令中，我们没有使用-c选项，因此gcc会进行链接操作，生成最终的可执行文件。

当执行gcc main.o -o main命令时，gcc会将目标文件main.o与所需的库文件（如果有的话）一起进行链接，并生成最终的可执行文件main。这个可执行文件就是可以在Linux下运行的C程序。

执行./main命令会运行名为main的可执行文件。这是我们之前用gcc命令生成的C程序的可执行文件。

总结

生成可执行程序过程为成四个步骤：

由.c文件到.i文件，这个过程叫预处理。

由.i文件到.s文件，这个过程叫编译。

由.s文件到.o文件，这个过程叫汇编。

由.o文件到可执行文件，这个过程叫链接。

在集成开发环境中，点击"编译"按钮后，IDE会自动完成上述四个阶段，无需手动执行每个步骤。如果没有编译错误，最终的可执行文件将生成并可以在IDE中直接运行。

虽然IDE为我们提供了方便的编译工具，但了解C语言的编译过程仍然对于程序员来说是重要的，特别是在解决一些编译错误或进行优化时，理解底层过程可以帮助我们更好地理解和改进代码。

GCC编译过程：预处理-＞编译-＞汇编-＞链接

引言

概括介绍

一、预处理

二、编译

三、汇编

四、链接

总结

猜你喜欢