GCC详解-Binutils工具之nm

1、介绍

nm用来列出目标文件中的符号,用以定位和分析执行程序和目标文件中的符号信息和它的属性。它可以和readelf、objdump、addr2line工具配合使用。

1.1 参数总结

选项

描述

-A

同选项 --print-file-name

-a

同选项 --debug-syms

-B

同选项 --format=bsd。这是默认设置

-C [type]

同选项 --demangle

-D

同选项 –dynamic

--debug-syms

显示调试器使用的符号。通常不会显示这些符号

--demangle[=type]

demangles 符号,使它变回源代码中找到的用户级的名字。如果指定类型,会为如下类型之一:auto、gnu、lucid、arm、hp、edg、gnu-v3、java、gnat 或 compaq

--dynamic

对于动态目标,例如共享库,该选项可以显示动态符号而不是普通符号

--extern-only

显示定义为外部的符号

-f fmt

同选项 --format

--format=fmt

使用指定的输出格式显示符号。可选的格式包括 bsd、sysv 和 posix,其中 bsd 为默认格式

-g

同选项 --extern-only

-h

显示选项列表,然后退出

--help

显示选项列表,然后退出

-l

同选项 --line-numbers

--line-numbers

使用文件中保存的调试信息来确定文件名和每个符号的行号

-n

同选项 --numeric-sort

--no-sort

指出不要将符号排序

--numeric-sort

按照符号地址的数值排序

-o

同选项 --print-file-name

-p

同选项 --no-sort

-P

同选项 --format=posix

--portability

同选项 --format=posix

--print-armap

在列举静态库成员符号时,该选项包含了模块的索引信息及其他信息,正是该模块含有所列符号

--print-file-name

用源文件的名字标记每个符号,而不是只在文件头命名源文件

-r

同选项 --reverse-sort

--radix=base

指出打印符号值的数字的进制。可选的为 d 的十进制、o 的八进制、或 x 的十六进制

--reverse-sort

反序排列,不论字母还是数字均可

-s

同选项 --print-armap

--size-sort

按照尺寸进行符号排序。计算尺寸取的是下一个符号的最高地址和本符号的地址的差。输出列出的是尺寸而不是通常的地址

-t base

同选项 --radix

--target=bfdname

bfdname 是目标文件格式的名字,它不是当前机器的名字。为得到已知格式名字列表,键入命令 objdump –i

-u

同选项--undefined-only

--undefined-only

只显示文件引用但未定义的符号

-V

同选项 --version

--version

显示版本信息,然后退出

1.2 类型总结

用nm可以得到类似如下的结果:

$ nm main.o
0000000000000004 C bbb
0000000000000000 D ccc
0000000000000008 D ddd
0000000000000000 T main
                                 U printf

对于每一个符号,提供了其地址、类型、符号名。那么这些类型代表什么含义呢?我们总结到如下表格里:

符号类型 说明
A 该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。
B 该符号的值出现在非初始化数据段(bss)中。例如,在一个文件中定义全局static int test。则该符号test的类型为b,位于bss section中。其值表示该符号在bss段中的偏移。一般而言,bss段分配于RAM中
C 该符号为common。common symbol是未初始话数据段。该符号没有包含于一个普通section中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个c文件中,定义int test,并且该符号在别的地方会被引用,则该符号类型即为C。否则其类型为B。
D 该符号位于初始话数据段中。一般来说,分配到data section中。例如定义全局int baud_table[5] = {9600, 19200, 38400, 57600, 115200},则会分配于初始化数据段中。
G 该符号也位于初始化数据段中。主要用于small object提高访问small data object的一种方式。
I 该符号是对另一个符号的间接引用。
N 该符号是一个debugging符号。
R 该符号位于只读数据区。例如定义全局const int test[] = {123, 123};则test就是一个只读数据区的符号。注意在cygwin下如果使用gcc直接编译成MZ格式时,源文件中的test对应_test,并且其符号类型为D,即初始化数据段中。但是如果使用m6812-elf-gcc这样的交叉编译工具,源文件中的test对应目标文件的test,即没有添加下划线,并且其符号类型为R。一般而言,位于rodata section。值得注意的是,如果在一个函数中定义const char *test = “abc”, const char test_int = 3。使用nm都不会得到符号信息,但是字符串“abc”分配于只读存储器中,test在rodata section中,大小为4。
S 符号位于非初始化数据区,用于small object。
T 该符号位于代码区text section。
U 该符号在当前文件中是未定义的,即该符号的定义在别的文件中。例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是T。但是对于全局变量来说,在定义它的文件中,其符号类型为C,在使用它的文件中,其类型为U。
V 该符号是一个weak object。
W The symbol is a weak symbol that has not been specifically tagged as a weak object symbol.
- 该符号是a.out格式文件中的stabs symbol。
? 该符号类型没有定义

2、例子

我们创建一个文件main.c:

#include <stdio.h>

int bbb;
int ccc = 20;
char *ddd = "abcdefg";

int main()
{
        int aaa = 10;
        printf("tttttt : %d\n", aaa);
        return 0;
}

然后编译其生成.o文件:

$ gcc -c main.c

$ ls
main.c  main.o

这时我们通过nm命令查看:

$ nm main.o
0000000000000004 C bbb
0000000000000000 D ccc
0000000000000008 D ddd
0000000000000000 T main
                                 U printf

可见:

1)aaa不在里面,因为它是局部变量

2)bbb类型为C,因为它是未初始化的全局变量

3)ccc和ddd类型为D,因为它是初始化的全局变量,所以在初始化数据段

4)main位于代码区

5)printf当前未定义

如果我们把main.o链接成可执行文件后,可见其符号就会多很多:

$ gcc main.o -o main
$ nm main
000000000060104c B bbb
0000000000601048 B __bss_start
0000000000601038 D ccc
0000000000601048 b completed.7594
0000000000601028 D __data_start
0000000000601028 W data_start
0000000000601040 D ddd
0000000000400460 t deregister_tm_clones
00000000004004e0 t __do_global_dtors_aux
0000000000600e18 t __do_global_dtors_aux_fini_array_entry
0000000000601030 D __dso_handle
0000000000600e28 d _DYNAMIC
0000000000601048 D _edata
0000000000601050 B _end
00000000004005c4 T _fini
0000000000400500 t frame_dummy
0000000000600e10 t __frame_dummy_init_array_entry
0000000000400710 r __FRAME_END__
0000000000601000 d _GLOBAL_OFFSET_TABLE_
                 w __gmon_start__
00000000004005ec r __GNU_EH_FRAME_HDR
00000000004003c8 T _init
0000000000600e18 t __init_array_end
0000000000600e10 t __init_array_start
00000000004005d0 R _IO_stdin_used
                 w _ITM_deregisterTMCloneTable
                 w _ITM_registerTMCloneTable
0000000000600e20 d __JCR_END__
0000000000600e20 d __JCR_LIST__
                 w _Jv_RegisterClasses
00000000004005c0 T __libc_csu_fini
0000000000400550 T __libc_csu_init
                 U __libc_start_main@@GLIBC_2.2.5
0000000000400526 T main
                 U printf@@GLIBC_2.2.5
00000000004004a0 t register_tm_clones
0000000000400430 T _start
0000000000601048 D __TMC_END__

也可以看到printf虽然还是标记为U,但是明确指出来它在哪里:U printf@@GLIBC_2.2.5。

Guess you like

Origin blog.csdn.net/sjwangjinbao/article/details/119078882