学习交流加

  • 个人qq:
    1126137994
  • 个人微信:
    liu1126137994
  • 学习交流资源分享qq群:
    962535112

上一篇文章学习addr2line与strip工具。点击链接查看上一篇文章:点击查看

本篇文章学习两个工具:ar与nm工具。

1、ar工具

ar工具很简单,用于将目标文件打包生成库或者将目标文件从库中解压出来

  • ar crs libname.a x.o y.o 将x.o y.o打包生成libname.a库
  • ar x libname.a 将libname.a库解压

2、nm工具

nm工具用于列出目标文件的符号的相关信息:地址,属性,名字等

使用nm工具,可以输出三部分内容:地址,段,标识符

如下图的例子;

其中标识符位于的段信息,需要说明一下。上述的T代表代码段。还有很多其他段标识符如下图:

它们具体的信可以参考《程序员的自我修养》,参考这本书后,可以更加详细的说明各个段标识代表什么意思。如下表:

A 该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。
B 该符号的值出现在非初始化数据段(.bss)中。例如,在一个文件中定义全局static int test。则该符号test的类型为b,位于bss section中。其值表示该符号在bss段中的偏移。一般而言,bss段分配于RAM中 。
C 该符号为common。common symbol是未初始话数据段。该符号没有包含于一个普通section中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个c文件中,定义int test,并且该符号在别的地方会被引用,则该符号类型即为C。否则其类型为B。
D 该符号位于初始化数据段中。一般来说,分配到.data section中。例如定义全局int baud_table[5] = {9600, 19200, 38400, 57600, 115200},则会分配于初始化数据段中。
G 该符号也位于初始化数据段中。主要用于small object提高访问small data object的一种方式。
I 该符号是对另一个符号的间接引用。
N 该符号是一个debugging符号。
R 该符号位于只读数据段。例如定义全局const int test[] = {123, 123};则test就是一个只读数据区的符号。注意在cygwin下如果使用gcc直接编译成MZ格式时,源文件中的test对应_test,并且其符号类型为D,即初始化数据段中。但是如果使用m6812-elf-gcc这样的交叉编译工具,源文件中的test对应目标文件的test,即没有添加下划线,并且其符号类型为R。一般而言,位于rodata section。值得注意的是,如果在一个函数中定义const char *test = “abc”, const char test_int = 3。使用nm都不会得到符号信息,但是字符串“abc”分配于只读存储器中,test在rodata section中,大小为4。
S 符号位于非初始化数据段,用于small object。
T 该符号位于代码段text section。
U 该符号在当前文件中是未定义的,即该符号的定义在别的文件中。例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是T。但是对于全局变量来说,在定义它的文件中,其符号类型为C,在使用它的文件中,其类型为U。
V 该符号是一个weak object。
W The symbol is a weak symbol that has not been specifically tagged as a weak object symbol.
- 该符号是a.out格式文件中的stabs symbol。
? 该符号类型没有定义。

2.1 代码案例分析

还是以上一篇文章的代码为例(代码是运行时错误的,但是这不影响我们的实验);

test.c

#include <stdio.h>

int g_global = 0;
int g_test = 1;

extern int* g_pointer;
extern void func();

int main(int argc, char *argv[])
{
    printf("&g_global = %p\n", &g_global);
    printf("&g_test = %p\n", &g_test);
    printf("&g_pointer = %p\n", &g_pointer);
    printf("g_pointer = %p\n", g_pointer);
    printf("&func = %p\n", &func);
    printf("&main = %p\n", &main);
    
    func();
	
    return 0;
}

func.c

#include <stdio.h>

int* g_pointer;

void func()
{
	*g_pointer = (int)"D.T.Software";

    return;
}

对以上两个程序分别进行如下编译:

  • gcc -g -c func.c -o func.o
  • gcc -g -c test.c -o test.o

然后使用nm工具分别查看func.o与test.o

通过以上结果,可以看出

在func.o中:

  • func符号位于代码段,这显而易见
  • g_pointer符号是一个未定义存储段的符号。参考上表即可知道它的意思

在test.o中

  • func未定义,因为它本身是在func.c中定义的
  • g_global位于.bss段
  • g_pointer未定义
  • g_test位于数据段
  • main位于代码段
  • printf未定义,因为它是引自标准库中的代码

3、总结

学会使用ar工具与nm工具。了解nm输出对应的符号的说明信息,参考本文表格。

本文参考狄泰软件学院相关课程
想学习的可以加狄泰软件学院群,
群聊号码:199546072

学习探讨加个人(可以免费帮忙下载CSDN资源):
qq:1126137994
微信:liu1126137994