c语言中动态库的使用（启动时链接和运行时链接）

背景

c语言中存在静态库(.a)和动态库(.so)。

静态库实际上是一些目标文件的集合，只用于链接生成可执行文件阶段。链接器会将程序中使用到函数的代码从库文件中拷贝到应用程序中，一旦链接完成生成可执行文件之后，在执行程序的时候就不需要静态库了。

特性：

由于每个使用静态库的应用程序都需要拷贝所用函数的代码，所以静态链接的生成的可执行文件会比较大，多个程序运行时占用内存空间比较大(每个程序在内存中都有一份重复的静态库代码)
由于运行的时候不用从外部动态加载额外的库了，速度会比共享库快一些
更换一个静态库或者修改一个静态库后，需要重新编译应用程序

动态库也叫共享库（share object）,在程序链接的时候只是作些标记，然后在程序开始启动运行的时候，动态地加载所需库（模块）。

特性：

应用程序在运行的时候需要共享库
共享库链接出来的可执行文件比静态库链接出来的要小得多，运行多个程序时占用内存空间比也比静态库方式链接少(因为内存中只有一份共享库代码的拷贝)
由于有一个动态加载的过程所以速度稍慢
更换动态库不需要重新编译程序，只需要更换相应的库即可

动态库和静态库各有特点，适用于不同的场合。本文主要阐述动态库的使用，重点在于显式运行时链接。

动态库的产生和使用

可以通过编译时使用-shared -fPIC参数产生动态库。

gcc -shared -fPIC -o libtest.so test.c

动态库生成之后，就可以使用-ltest -L. 的方式使用该动态库。

/* module.c */
#include <stdio.h>

int m_pr(void)
{
    printf("this is module1.\n");

    return 0;
}

/* module.h */
#ifndef LIB_H
#define LIB_H

int m_pr(void);

#endif

使用 gcc -shared -fPIC -o libmodule.so module.c生成动态库。

/* test.c */
#include <stdio.h>
#include "module.h"

int main(void)
{
    printf("------------------------\n");
        m_pr();
    printf("------------------------\n");

    return 0;
}

此时，直接使用 gcc test.c会报错：

> % gcc test.c 
/tmp/ccmkXs3N.o：在函数‘main’中：
test.c:(.text+0x16)：对‘m_pr’未定义的引用
collect2: error: ld returned 1 exit status

很明显，程序不能找到m_pr的定义，程序在编译时就依赖于所使用的库。使用 gcc test.c -lmodule -L.编译生成可执行文件。运行结果如下：

./a.out: error while loading shared libraries: libabc.so: cannot open shared object file: No such file or directory

找不到该共享库，即程序启动时依赖于该共享库。执行export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/yao/test/so_lib把库的路径加到LD_LIBRARY_PATH里面就ok了，运行结果如下：

-> % ./a.out 
------------------------
this is module1.
------------------------

显式运行时链接动态库

显式运行时链接（explicit run-time linking），也叫运行时加载，可以使程序自己在运行时控制加载的指定的模块，并在不需要使用的时候卸载。

运行时加载使得程序的模块组织更加灵活，可以实现诸如插件、驱动等功能，实现了使用时才加载、使用完即卸载。其特性如下：

不必从程序一开始就将其全部装载进来，减少了程序启动时间和内存使用
程序不必重启就可以实现模块的增加、删除、更新等

在linux系统中，动态和一般的共享对象在文件格式上看并没有区别。它们的区别主要体现在加载和使用的方式上：

共享对象是由动态链接器在程序启动之前负责装载和链接，由动态链接器自动完成，对应用程序来说是透明的
动态库的装载是通过动态链接器提供的API完成的

动态链接器提供的API主要有4个：dlopen(), dlsym(), dlclose(), dlerror()，使用它们的时候需要包含 #include <dlfcn.h>。

dlopen()

void *dlopen(const char *filename, int flag);

打开一个动态库，并将其加载到进程的地址空间，完成初始化过程。

第一个参数是被加载动态库的路径。如果是绝对路径，函数会尝试直接打开此动态库，如果是相对路径，函数会按以下顺序查找该动态库文件：

查找环境变量LD_LIBRARY_PATH指定的目录
查找由 /etc/ld.so.cache里面指定的共享库路径
/lib, /usr/lib

注意，如果把该参数设置为0，将会返回全局符号表的句柄。也就是说，我们可以在运行时找到全局符号表里的任何一个符号并执行它们。

第二个参数是函数符号的解析方式。取值可以是 RTLD_LAZY/RTLD_NOW|RTLD_GLOBAL，其中，RTLD_LAZY表示延迟绑定，当函数第一次被调用时才进行绑定，而RTLD_NOW则是模块被加载时就进行绑定。这两种绑定方式只能选择一个，而它们都可以与RTLD_GLOBAL一起使用，表示将被加载的模块的全局符号合并到进程的全局符号表中，使得以后加载的模块可以使用这些符号。

dlopen的返回值是被加载模块的句柄，供后面调用其他函数时使用。如果加载失败，返回 NULL。如果模块已经被加载过了，返回同一个句柄。

dlsym()

void *dlsym(void *handle, char *symbol);

找到指定句柄中的符号。

第一个参数是使用dlopen返回的句柄，第二个参数是所需要查找的符号，是一个以'\0'结尾的字符串。如果找到了该符号，返回符号的值，如果未找到符号，则返回 NULL。

如果查找的是个函数，返回函数的地址
如果是变量，返回变量的地址
如果是常量，返回常量的值

如果返回的常量值刚好是NULL或0，就需要调用dlerror()函数判断是否调用成功。如果返回NULL，则调用成功且符号找到。如果返回错误信息，则未找到该符号

dlclose()

int dlclose(void *handle);

与dlopen作用相反，关闭打开的句柄，卸载已加载的某个模块。

系统会维持一个加载引用计数器，每次使用dlopen加载某个模块时，相应的计数器加1，每次使用dlclose卸载某个模块时，相应的计数器减1。只有当计数器值减到0时，模块才被真正地卸载掉。

dlerror()

char *dlerror(void);

每次调用dlopen, dlsym, dlclose之后都可以调用dlerror()来判断上一次调用是否成功。

返回NULL，则上一次调用成功
上一次调用失败，则返回相应的错误信息

例子

修改上述test.c为下：

/* test.c */
#include <stdio.h>
#include <dlfcn.h>

int (*module_pr)(void);

int main(void)
{
    void *h;

    printf("------------------------\n");
    h = dlopen("./libabc.so", RTLD_NOW|RTLD_GLOBAL);
    if (!h) {
        printf("dlopen error:%s\n", dlerror());
        return -1;
    }

    module_pr = dlsym(h, "m_pr");
    if (dlerror() != NULL) {
        printf("dlsym m_pr error:%s\n", dlerror());
        return -1;
    }

    module_pr();
    dlclose(h);
    dlerror();

    printf("------------------------\n");

    return 0;
}

执行 gcc test.c，报错如下：

-> % gcc test.c 
/tmp/ccM9fcKC.o：在函数‘main’中：
test.c:(.text+0x25)：对‘dlopen’未定义的引用
test.c:(.text+0x35)：对‘dlerror’未定义的引用
test.c:(.text+0x60)：对‘dlsym’未定义的引用
test.c:(.text+0x6a)：对‘dlerror’未定义的引用
test.c:(.text+0x73)：对‘dlerror’未定义的引用
test.c:(.text+0x9d)：对‘dlclose’未定义的引用
test.c:(.text+0xa2)：对‘dlerror’未定义的引用
collect2: error: ld returned 1 exit status

修改为 gcc test.c -ldl编译通过，运行结果如下：

-> % ./a.out 
------------------------
this is module1.
------------------------

可见，程序编译时已经不再依赖动态库了，只有到运行时才动态加载所需要的库。

总结

在使用动态库时，可以选择显式运行时链接，但这样会增加一些代码。

对于服务器端的应用程序来说，显式运行时链接可以在程序不重启的情况下加载更新后的动态库，这对于7*24小时工作的服务器来说是至关重要的。

不同的项目可以根据实际情况选择不同的实现方式。