ARM 架构及汇编

1.ARM 架构及汇编

1.1 ARM架构

ARM芯片属于精简指令集计算机(RISC:Reduced Instruction Set Computor),它所用的指令比较简单,有如下特点:

对内存只有读、写指令

② 对于数据的运算是在CPU内部实现

③ 使用RISC指令的CPU复杂度小一点,易于设计

cpu与RAM和flash之间有地址总线和数据总线,cpu访问内存时,会发出地址addr,然后会得到数据。
比如对于a=a+b这样的算式,需要经过下面4个步骤才可以实现:

在这里插入图片描述

细看这几个步骤,有些疑问:

① 读a,那么a的值读出来后保存在CPU里面哪里?

② 读b,那么b的值读出来后保存在CPU里面哪里?

③ a+b的结果又保存在哪里?

我们需要深入ARM处理器的内部。简单概括如下,我们先忽略各种CPU模式(系统模式、用户模式等等)。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-x1t0o9bG-1650416928467)(pic/arm/02_cpu_registers.png)]

CPU运行时,先去取得指令,再执行指令:

① 把内存a的值读入CPU寄存器R0

② 把内存b的值读入CPU寄存器R1

③ 把R0、R1累加,存入R0(对于数据的运算是在cpu内部执行)

④ 把R0的值写入内存a

CPU内部有r0到r15寄存器,这些寄存器有别名(下图来自百度文库):

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XJwGESzX-1650416928468)(pic/arm/03_cpu_reg_names.png)]

1.2 几条汇编指令

需要我们掌握的汇编指令并不多,只有几条:

  • 读内存指令:LDR,即Load之意,加载寄存器,表示读4个字节,可以加后缀,B:LDRB表示读1个字节, H:LDRH表示读2个字节。
  • 写内存指令:STR,即Store之意,存储的意思,可以加后缀,B:STRB表示写1个字节,STRH:2个字节
  • 加减指令:ADD、SUB,不涉及内存操作即不用访问地址,只在cpu内部来实现
  • 跳转:BL,即Branch And Link,
  • 入栈指令:PUSH
  • 出栈指令:POP

在栈的操作里,高标号的寄存器放在高地址Rn,低标号的寄存器放在低地址Rn-1

汇编并不复杂:

加载/存储指令(LDR/STR)

  • 加载指令LDR: LDR r0,[r3] 意思是将地址r3的内容加载(存放)到r0里面 ,r0=*r3,去r3表示的地址读数据放入r0,注意r3是一个地址,不能使用MOV R0, R3,这个表示的意思是:将寄存器 R3 中的数据传递给 R0,即 R0=R3。
  • 存储指令STR: STR r0,[r3] 意思是将r0中的值存储到地址r3上 ,*r3=r0,把r0的值写到r3指示的地址上去,注意r3是一个地址,不能使用MOV R3, R0,这个表示的意思是:将寄存器 R0 中的数据传递给 R3,即 R3=R0。

加法运算指令(ADD)

  • 加法运算指令(ADD): ADD r0,r1,r2 意思为:r0=r1+r2
  • 减法运算指令(SUB): SUB r0,r1,r2 意思为:r0=r1-r2

寄存器入栈/出栈指令(PUSH/POP)

  • 寄存器入栈(PUSH): PUSH {r3,lr} 意思是将寄存器r3和lr(用来存放当前子程序的返回地址)写入内存栈
    • 本质是写内存STR指令,高标号寄存器写入高地址的栈里,低标号寄存器写入低地址的栈里,多次调用STR指令,并调整sp的值,先将sp=sp-4,再将r14的值放进去, sp=sp-4 [sp]=lr(即将lr中的内容放入sp所指的内存地址,后面亦是如此,不做阐述),sp=sp-4, [sp]=r3
    • lr即r14,写入地址为sp-4的内存,然后:sp=sp-4
    • r3,写入地址为sp-4的内存,然后:sp=sp-4
  • 寄存器出栈指令(POP): POP {r3,pc} 意思是取出内存栈的数据放入r3和pc中
    • 本质是读内存LDR指令,高标号寄存器的内容来自高地址的栈,低标号寄存器的内容来自低地址的栈,r3=[sp] (即将sp所指的内存地址的内容放入r3寄存器) ,sp=sp+4,pc=[sp],sp=sp+4
    • 读地址为sp的内存存入r3,然后:sp=sp+4
    • 读地址为sp的内存存入pc,然后:sp=sp+4

跳转指令BL

  • 跳转到标号地址,并将返回地址保存在 LR 中,R14(LR)来存放当前子程序的返回地址, BL A ,此指令有两个作用,第一记录返回地址(下一条指令的地址),保存在R14(LR),第二执行A函数。

1.3 函数运行的本质

如下是一个简单的程序

主函数里调用函数add_val()

void add_val(int *pa, int *pb)
{
    
    
	volatile int tmp;
	
	tmp = *pa;
	tmp = tmp + *pb;
	*pa = tmp;
}


int main()
{
    
    
	int a = 1;
	int b = 2;
	
	add_val(&a, &b);

	return 0;
}

其中调用函数add_val()的汇编代码如下,我们加上了注释:

1   /* enter */ 
2   PUSH     {
    
    r3,lr}         //进入函数,寄存器r3、lr的值,都存入内存的栈中(lr保存程序返回地址)
3  
4   /* tmp = *pa; */ 
5   LDR      r2,[r0,#0x00]   //将寄存器r0的值存放到r2,其中r0是函数的第一个参数值(ARM ATPCS规定)
6   STR      r2,[sp,#0x00]   //将寄存器r2的值存储到sp指向的内存
7 
8   /* tmp = tmp + *pb;  */
9   LDR      r2,[r1,#0x00]   //将寄存器r1的值存放到r2,其中r1是函数的第二个参数值(ARM ATPCS规定)
10  LDR      r3,[sp,#0x00]   //将寄存器sp指向内存的值存放到r3
11  ADD      r2,r2,r3        //将寄存器r2和r3相加,保存到r2
12  STR      r2,[sp,#0x00]   //将寄存器r2的值存储到sp指向的内存 
13 
14  /* *pa = tmp; */ 
15  LDR      r2,[sp,#0x00]   //将寄存器sp指向内存的值存放到r2
16  STR      r2,[r0,#0x00]   //将寄存器r2的值存储到r0,其中r0将作为函数返回值(ARM ATPCS规定)
17  
18  /* quit */
19  POP      {
    
    r3,pc}         //退出函数,获取内存的栈中的数据放入r3和pc中(此时pc为lr,实现了函数返回)

解析过程
注:本文出自韦老师的教学

猜你喜欢

转载自blog.csdn.net/qq_45761493/article/details/124289029