彻底理解链接器:四

承接上一篇文章《彻底理解链接器:三》

目录

动态库vs静态库

过程三:重定位

编译器的工作


动态库vs静态库

在计算机的历史当中,最开始程序只能静态链接,但是人们很快发现,静态链接生成的可执行文件存在磁盘空间浪费问题,因为对于每个程序都需要依赖的libc库,在静态链接下每个可执行文件当中都有一份libc代码和数据的拷贝,为解决该问题才提出动态库。

在前几节我们知道,动态链接下可执行文件当中仅仅保留动态库的必要信息,因此解决了静态链接下磁盘浪费问题。动态库的强大之处不仅仅于此,我们知道对于现代计算机系统,比如PC,通常会运行成百上千个程序(进程),且程序只有被加载到内存中才可以使用,如果使用静态链接那么在内存中就会有成百上千份同样的libc代码,这对于宝贵的内存资源同样是极大的浪费,而使用动态链接,内存中只需要有一份libc代码,所有的程序(进程)共享这一份代码,因此极大的节省了内存资源,这也是为什么动态库又叫共享库。

动态库还有另外一个强大之处,那就是如果我们修改了动态库的代码,我们只需要重新编译动态库就可以了而无需重新新编译我们自己的程序,因为可执行文件当中仅仅保留了动态库的必要信息,重新编译动态库后这些必要都信息是不会改变的(只要不修改动态库的名字和动态库导出的供可执行文件使用的函数),编译好新的动态库后只需要简单的替换原有动态库,下一次运行程序时就可以使用新的动态库了,因此动态库的这种特性极大的方便了程序升级和bug修复。我们平时使用都客户端程序,比如我们常用QQ,输入法,播放器,都利用了动态库的这一优点,原因就在于方便升级以bug修复,只需要更新相应的动态库就可以了。

动态库的优点不止于此,我们知道动态链接可以出现在运行时(run-time dynamic link),动态链接的这种特性可以用于扩展程序能力,那么如何扩展呢?你肯定听说过一样神器,没错,就是插件。你有没有想过插件是怎么实现的?实现插件时,我们只需要实现几个规定好的几个函数,我们的插件就可以运行了,可这是怎么做到的呢,答案就在于运行时动态链接,可以将插件以动态的都方式实现。我们知道使用运行时动态链接无需在编译链接期间告诉链接器所使用的动态库信息,可执行文件对此一无所知,只有当运行时才知道使用什么动态库,以及使用了动态库中哪些函数,但是在编译链接可执行文件时又怎么知道插件中定义了哪些函数呢,因此所有的插件实现函数必须都有一个统一的格式,程序在运行时需要加载所有插件(动态库),然后调用所有插件的入口函数(统一的格式),这样我们写的插件就可以被执行起来了。

动态库都强大优势还体现在多语言编程上。我们知道使用Python可以快速进行开发,但Python的性能无法同C/C++相比(因为Python是解释型语言,至于什么是解释型语言我会在后面码农的荒岛求生系列文章当中给大家详细讲解),有没有办法可以兼具Python的快速开发能力以及C/C++的高性能呢,答案是可以的,我们可以将C/C++代码编译链接成动态库,这样python就可以直接调用动态库中的函数了。不但Python,Perl以及Java等都可以通过动态库的形式调用C/C++代码。动态库的使用使得同一个项目不同语言混合编程成为可能,而且动态库的使用更大限度的实现了代码复用。

了解了动态库的这么多优点,那么动态库就没有缺点吗,当然是有的。

扫描二维码关注公众号,回复: 9650028 查看本文章

首先由于动态库是程序加载时或运行是才进行链接的,因此同静态链接相比,使用动态链接的程序在性能上要稍弱于静态链接,这时因为对于加载时动态链接,这无疑会减慢程序都启动速度,而对于运行时链接,当首次调用到动态库的函数时,程序会被暂停,当链接过程结束后才可以继续进行。且动态库中的代码是地址无关代码(Position-Idependent Code,PIC),之所以动态库中的代码是地址无关代码是因为动态库又被成为共享库,所有的程序都可以调用动态库中的代码,因此在使用动态库中的代码时程序要多做一些工作,这里我们不再具体展开讲解到底程序多做了哪些工作,对此感兴趣当同学可以参考CSAPP(深入理解计算机系统)。这里我们说动态链接的程序性能相比静态链接稍弱,但是这里的性能损失是微乎其微的,同动态库可以带来的好处相比,我们可以完全忽略这里的性能损失,同学们可以放心的使用动态库。

动态库的一个优点其实也是它的缺点,即动态链接下的可执行文件不可以被独立运行(这里讨论的是加载时动态链接,load-time dynamic link),换句话说就是,如果没有提供所依赖的动态库或者所提供的动态库版本和可执行文件所依赖的不兼容,程序是无法启动的。动态库的依赖问题会给程序的安装部署带来麻烦,在Linux环境下尤其严重,以笔者曾参与开发维护的一个虚拟桌面系统为例,我们在开发过程中依赖的一些比较有名的第三方库默认不会随着安装包发布,这就会导致用户在较低版本Linux中安装时经常会出现程序无法启动的问题,原因就在于我们编译链接使用都动态库和用户Linux系统中都动态库不兼容。解决这个问题的方法通常有两种,一个是用户升级系统中都动态库,另一个是我们讲需要都第三方库随安装包一起发布,当然这是在取得许可的情况下。

在了解了动态库的优缺点后,接下来我们来看一下静态库。

静态链接是最古老也是最简单的链接技术。静态链接都最大优点就是使用简单,编译好的可执行文件是完备的,即静态链接下的可执行文件不需要依赖任何其它的库,因为静态链接下,链接器将所有依赖的代码和数据都写入到了最终的可执行文件当中,这就消除了动态链接下的库依赖问题,没有了库都依赖问题就意味着程序都安装部署都得到了极大都简化。请大家不要小看这一点,这对当今那些拥有海量用户的后端系统来说至关重要,比如类似微信这种量级的系统,其后端会部署在成千上万台机器上,这么多的机器其系统的安装部署以及升级会给运维带来极大挑战,而静态链接下的可执行文件由于不依赖任何库,因为部署非常方便,仅仅用一个新的可执行文件进行覆盖就可以了,因此极大的简化了系统部署以及升级。笔者之前所在的某电商广告后端系统就完全使用静态链接来简化部署升级。

而静态库的缺点相信大家都已经清楚了,那就是静态链接会导致可执行文件过大,且多个程序静态链接同一个静态库的话会导致磁盘浪费的问题。

到这里关于静态库和动态库的讨论就告一段落了,相信大家对于这两种链接类型都有了清晰都认知。接下来让我们稍作休息,开始链接器的下一个重要功能,重定位。

过程三:重定位

程序的运行过程就是CPU不断的从内存中取出指令然后执行执行的过程,对于函数调用来说比如我们在C/C++语言中调用简单的加法函数add,其对应的汇编指令可能是这样的:

call 0x4004fd

其中0x4004fd即为函数add在内存中的地址,当CPU执行这条语句的时候就会跳转到0x4004fd这个位置开始执行函数add对应的机器指令。

再比如我们在C语言中对一个全局变量g_num不断加一来进行计数,其对应的汇编指令可能是这样的:

mov 0x400fda %eax

add $0x1 %eax

这里的意思是把内存中 0x400fda 这个地址的数据放到寄存器当中,然后将寄存器中的数据加一,在这里g_num这个全局变量的内存地址就是0x400fda。

好奇的同学可能会问,那这些函数以及数据的内存地址是怎么来的呢?

确定程序运行时的内存地址就是接下来我们要讲解的重点内容,这里先给出答案,可执行文件中代码以及数据的运行时内存地址是链接器指定的,也就是上面示例中add的内存地址0x4004fd其是链接器指定的。确定程序运行时地址的过程就是这里重定位(Relocation)。

为什么这个过程叫做重定位呢,之所以叫做重定位是因为确定可执行文件中代码和数据的运行时地址是分为两个阶段的,在第一个阶段中无法确定这些地址,只有在第二个阶段才可以确定,因此就叫做重定位。接下来让我们来看看这两个阶段,合并同类型段以及引用符号的重定位。

编译器的工作

让我们回忆一下前几节的内容,源文件首先被编译器编译生成目标文件,目标文件种有三段内容:数据段、代码段以及符号表,所有的函数定义被放在了代码段,全局变量的定义放在了数据段,对外部变量的引用放到了符号表。

编译器在将源文件编译生成目标文件时可以确定一下两件事:

  • 定义在该源文件中函数的内存地址
  • 定义在该源文件中全局变量的内存地址

注意这里的内存地址其实只是相对地址,相对于谁的呢,相对于自己的。为什么只是一个相对地址呢?因为在生成一个目标文件时编译器并不知道这个目标文件要和哪些目标文件进行链接生成最后的可执行文件,而链接器是知道要链接哪些目标文件的。因此编译器仅仅生成一个相对地址。

而对于引用类的变量,也就是在当前代码中引用而定义是在其它源文件中的变量,对于这样的变量编译器是无法确定其内存地址的,这不是编译器需要关心的,确定引用类变量的内存地址是链接器的任务,链接器在进行链接时能够确定这类变量的内存地址。因此当编译器在遇到这样的变量时,比如使用了外部定义的函数时,其在目标文件中对应的机器指令可能是这样的:

call 0x000000

也就是说对于编译器不能确定的地址都这设置为空(0x000000),同时编译器还会生成一条记录,该记录告诉链接器在进行链接时要修正这条指令中函数的内存地址,这个记录就放在了目标文件的.rel.text段中。相应的如果是对外部定义的全局变量的使用,则该记录放在了目标文件的.rel.data段中。即链接器需要在链接过程中根据.rel.data以及.rel.text来填好编译器留下的空白位置(0x000000)。因此在这里我们进一步丰富目标文件中的内容,如图所示:

生成目标文件后,编译器完成任务,编译器确定了定义在该源文件中函数以及全局变量的相对地址。对于编译器不能确定的引用类变量,编译器在目标文件的.rel.text以及.rel.data段中生成相应的记录告诉链接器要修正这些变量的地址。

接下来就是链接器的工作了。

接下来的内容我会在该系列的下一篇文章当中介绍,如果你喜欢改系列的文章,欢迎关注我的维信公共账号,码农的荒岛求生,获取更多内容。

 

彻底理解链接器系列

  1. 彻底理解链接器:一,概念
  2. 彻底理解链接器:二,符号决议
  3. 彻底理解链接器:三,库与可执行文件
  4. 彻底理解链接器:四,重定位

彻底理解操作系统系列

  1. 什么程序?
  2. 进程?程序?傻傻分不清
  3. 程序员应如何理解内存:上篇
  4. 程序员应如何理解内存:下篇
发布了38 篇原创文章 · 获赞 30 · 访问量 4万+

猜你喜欢

转载自blog.csdn.net/github_37382319/article/details/82749991
今日推荐