1.ARM 架构及汇编

1.1 ARM架构

ARM芯片属于精简指令集计算机(RISC：Reduced Instruction Set Computor)，它所用的指令比较简单，有如下特点：

① 对内存只有读、写指令

② 对于数据的运算是在CPU内部实现

③ 使用RISC指令的CPU复杂度小一点，易于设计

cpu与RAM和flash之间有地址总线和数据总线，cpu访问内存时，会发出地址addr,然后会得到数据。
比如对于a=a+b这样的算式，需要经过下面4个步骤才可以实现：

在这里插入图片描述

细看这几个步骤，有些疑问：

① 读a，那么a的值读出来后保存在CPU里面哪里？

② 读b，那么b的值读出来后保存在CPU里面哪里？

③ a+b的结果又保存在哪里？

我们需要深入ARM处理器的内部。简单概括如下，我们先忽略各种CPU模式(系统模式、用户模式等等)。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-x1t0o9bG-1650416928467)(pic/arm/02_cpu_registers.png)]

CPU运行时，先去取得指令，再执行指令：

① 把内存a的值读入CPU寄存器R0

② 把内存b的值读入CPU寄存器R1

③ 把R0、R1累加，存入R0（对于数据的运算是在cpu内部执行）

④ 把R0的值写入内存a

CPU内部有r0到r15寄存器，这些寄存器有别名(下图来自百度文库)：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XJwGESzX-1650416928468)(pic/arm/03_cpu_reg_names.png)]

1.2 几条汇编指令

需要我们掌握的汇编指令并不多，只有几条：

读内存指令：LDR，即Load之意，加载寄存器,表示读4个字节，可以加后缀，B:LDRB表示读1个字节， H:LDRH表示读2个字节。
写内存指令：STR，即Store之意，存储的意思，可以加后缀，B:STRB表示写1个字节，STRH:2个字节
加减指令：ADD、SUB，不涉及内存操作即不用访问地址，只在cpu内部来实现
跳转：BL，即Branch And Link,
入栈指令：PUSH
出栈指令：POP

在栈的操作里，高标号的寄存器放在高地址Rn,低标号的寄存器放在低地址Rn-1

汇编并不复杂：

加载/存储指令(LDR/STR)

加载指令LDR： LDR r0,[r3] 意思是将地址r3的内容加载(存放)到r0里面 ,r0=*r3，去r3表示的地址读数据放入r0,注意r3是一个地址，不能使用MOV R0, R3，这个表示的意思是：将寄存器 R3 中的数据传递给 R0，即 R0=R3。

存储指令STR： STR r0,[r3] 意思是将r0中的值存储到地址r3上，*r3=r0，把r0的值写到r3指示的地址上去，注意r3是一个地址,不能使用MOV R3, R0，这个表示的意思是：将寄存器 R0 中的数据传递给 R3，即 R3=R0。

加法运算指令(ADD)

加法运算指令(ADD)： ADD r0,r1,r2 意思为：r0=r1+r2

减法运算指令(SUB)： SUB r0,r1,r2 意思为：r0=r1-r2

寄存器入栈/出栈指令(PUSH/POP)

寄存器入栈(PUSH)： PUSH {r3，lr} 意思是将寄存器r3和lr(用来存放当前子程序的返回地址)写入内存栈

本质是写内存STR指令，高标号寄存器写入高地址的栈里，低标号寄存器写入低地址的栈里，多次调用STR指令，并调整sp的值，先将sp=sp-4,再将r14的值放进去, sp=sp-4 [sp]=lr(即将lr中的内容放入sp所指的内存地址,后面亦是如此,不做阐述),sp=sp-4, [sp]=r3

lr即r14，写入地址为sp-4的内存，然后：sp=sp-4

r3，写入地址为sp-4的内存，然后：sp=sp-4

寄存器出栈指令(POP)： POP {r3，pc} 意思是取出内存栈的数据放入r3和pc中

本质是读内存LDR指令，高标号寄存器的内容来自高地址的栈，低标号寄存器的内容来自低地址的栈,r3=[sp] (即将sp所指的内存地址的内容放入r3寄存器) ,sp=sp+4,pc=[sp],sp=sp+4

读地址为sp的内存存入r3，然后：sp=sp+4

读地址为sp的内存存入pc，然后：sp=sp+4

跳转指令BL

跳转到标号地址，并将返回地址保存在 LR 中,R14(LR)来存放当前子程序的返回地址, BL A ，此指令有两个作用,第一记录返回地址(下一条指令的地址)，保存在R14(LR),第二执行A函数。

1.3 函数运行的本质

如下是一个简单的程序

主函数里调用函数add_val()：

void add_val(int *pa, int *pb)
{
    
    
	volatile int tmp;
	
	tmp = *pa;
	tmp = tmp + *pb;
	*pa = tmp;
}


int main()
{
    
    
	int a = 1;
	int b = 2;
	
	add_val(&a, &b);

	return 0;
}

其中调用函数add_val()的汇编代码如下，我们加上了注释：

1   /* enter */ 
2   PUSH     {
    
    r3,lr}         //进入函数，寄存器r3、lr的值，都存入内存的栈中(lr保存程序返回地址)
3  
4   /* tmp = *pa; */ 
5   LDR      r2,[r0,#0x00]   //将寄存器r0的值存放到r2，其中r0是函数的第一个参数值(ARM ATPCS规定)
6   STR      r2,[sp,#0x00]   //将寄存器r2的值存储到sp指向的内存
7 
8   /* tmp = tmp + *pb;  */
9   LDR      r2,[r1,#0x00]   //将寄存器r1的值存放到r2，其中r1是函数的第二个参数值(ARM ATPCS规定)
10  LDR      r3,[sp,#0x00]   //将寄存器sp指向内存的值存放到r3
11  ADD      r2,r2,r3        //将寄存器r2和r3相加，保存到r2
12  STR      r2,[sp,#0x00]   //将寄存器r2的值存储到sp指向的内存 
13 
14  /* *pa = tmp; */ 
15  LDR      r2,[sp,#0x00]   //将寄存器sp指向内存的值存放到r2
16  STR      r2,[r0,#0x00]   //将寄存器r2的值存储到r0，其中r0将作为函数返回值(ARM ATPCS规定)
17  
18  /* quit */
19  POP      {
    
    r3,pc}         //退出函数，获取内存的栈中的数据放入r3和pc中(此时pc为lr,实现了函数返回)

解析过程
注：本文出自韦老师的教学

ARM 架构及汇编

文章目录

1.ARM 架构及汇编

1.1 ARM架构

1.2 几条汇编指令

1.3 函数运行的本质

猜你喜欢