在现代编程中,已经很少能见到纯汇编语言写的程序,但由于C/C+等高级语言在编译时会进行优化等,使得我们不能准确知道一段C代码在CPU上执行时的具体机器码操作,而对于某些特殊场景(如测试)又需要知道准确的指令操作,此时可以在C代码中使用嵌入式汇编。C/C+中的关键字asm,是告诉GCC编译器后面括号内的代码是内嵌汇编。
内嵌式汇编格式: __asm__( " 指令列表" : "输出列表 " : "输入列表 " :"破坏描述部分 "); 注意()里面的三个冒号缺一不可。
如果想告诉编译器 不要优化自己的代码,可以在asm后边加上volatile 。
汇编指令之间需要使用分隔符(delimiter)如:“;”、“\n”或者“\n\t”分开。除了常规汇编中的操作数(立即数、寄存器、变量)之外,内嵌汇编中的汇编指令的操作数还可以是占位符,操作数占位符最多有10个,依次用%0,%1,%2,%3,···%9来表示,他们与操作数(包括输出列表、输入列表)出现的次序依次对应,代表相应的操作数。
GCC默认占位符指示的操作数是长整型的(4个字节),但可以通过操作数宽度后缀,可以让占位符指示的操作数字(2个字节)或1个字节。
输出列表中指示和描述了该段内嵌汇编的输出结果保存到什么变量中,这些变量通过占位符作为汇编语句中的操作数。在输出列表中多于1个变量时,变量之间用逗号隔开。“=”、“+” 这两个修饰符只用修饰输出变量。其中“=”表示输出变量只写,也就是说,不预先读入该输出变量到对应的寄存器中;而修饰符“+”表示必须先将输出变量预先读入到对应寄存器中,用于处理先读后写型变量。(如下面示例中的变量b,就需要用+来修饰)
输入列表中指示和描述了该段内嵌汇编的输入变量。这些变量也通过占位符作为汇编语句中的操作数。在输出列表中多于1个变量的情况下,变量之间用逗号隔开。同样,输入变量前也可以使用修饰字符来影响、改变编译器的行为。
寄存器破坏描述是一种机制,用来通知编译器此内嵌汇编中修改了哪些寄存器。否则,对寄存器的再次使用就可能导致错误,破坏描述就是起到这种作用。换句话说,就是通知编译器,哪些寄存器不能被隐式使用了。破坏描述符有逗号隔开的字符串组成,每个字符串描述一种情况,一般是寄存器名,此外还有内存“memory”和“cc”。我们称形如:“%eax”、“%ebx”、“%ecx”等为寄存器破坏描述符;称“memory”为内存描述符,表示修改了memory;“cc” 表示汇编程序代码修改了标志寄存器。 对于在input和output中已经绑定了的寄存器,不需要使用破坏描述符进行描述了。
以下是一个简单示例,嵌入式汇编代码和 对应的C语音代码都有体现。
/*
g++ -g -Wall test_asm_1.cpp -o sim
*/
#include <stdio.h>
#include <iostream>
using namespace std;
#define LOOP_NUM (10)
#define BUFF_SIZE (1 * 1024 ) // 1K size
long a[BUFF_SIZE / 8]; //long 8byte
#if 1
void load_buffer (size_t loops, size_t time, long *date1)
{
long b = 100;
asm volatile(
"mov %[date1], %%r10 ;"
"mov %[loops], %%rcx ;"
"L1: \n"
"mov %[time], %%rbx ;"
"xor %%rdx, %%rdx ;"
"L2: \n"
"add (%%r10,%%rdx, 1), %[b] ;"
"add $64, %%rdx ;"
"sub $1, %%rbx ;"
"jne L2 ;"
"loop L1 ;"
: [b]"+r"(b)
: [loops] "g" (loops),[time] "g" (time), [date1] "g" (date1)
: "r10","rcx","rbx","rdx","cc","memory"
);
cout<<dec<< "b :" << b <<endl;
}
#endif
#if 0
void load_buffer (size_t loops, size_t time, long *date1)
{
long b = 100;
for(int i = 0 ; i < LOOP_NUM; i++)
for(int j = 0 ; j < (BUFF_SIZE / 64) ; j ++)
{
b += date1[j * 8];
}
cout<<dec<< "b :" << b <<endl;
}
#endif
int main()
{
for (int k = 0; k < BUFF_SIZE / 64; k ++)
{
a[k * 8] = 0x1; // long a: 8 byte, step is 64byte
}
load_buffer(LOOP_NUM, (BUFF_SIZE / 64),a);
return 0;
}
指令部分在表示通用寄存器时(如%%rdx)使用了两个%,原因是需要与占位符进行区分。而纯汇编代码中,则只需要一个%即可。注意:此处都默认使用AT&T格式汇编,不采用intel格式,关于两者的区别可以参考https://www.cnblogs.com/hdk1993/p/4820353.html 。AT &T的mov基本格式为mov source, destination
xor %%rdx, %%rdx 这条异或指令用于将 %rdx 寄存器清零。
loop是循环指令,循环次数由计数寄存器%rcx指定。是否执行循环体的判断指令在循环体之后,所以,至少执行1次循环体,即至少循环1次。执行LOOP指令时,CPU自动将%rcx的值减1,若%rcx =0,则结束循环;否则,重复执行循环体。
%[loops] 和%[b]表示输入输出的参数,[b]"=r"(b) 是输出列表格式,"+r"是修饰符,输入列表中的"g"也是修饰符。asm中 r 对应eax,ebx,ecx,edx,esi,edi,当你在input或output中使用 超过6个r 时候就会出错。如果参数较多,可以使用 g 来修饰。限定符相关说明如下标所示。
内存破坏关系中 列出的寄存器 不能超过11 个,否则会报错。如果asm程序中修改了超过11个寄存器,那么没办法,请修改asm代码。
分类 |
限定符 |
描述 |
通用寄存器 |
a |
将输入变量放入eax这里有一个问题:假设eax已经被使用,那怎么办?其实很简单:因为GCC 知道eax 已经被使用,它在这段汇编代码的起始处插入一条语句pushl %eax,将eax 内容保存到堆栈,然后在这段代码结束处再增加一条语句popl %eax,恢复eax的内容 |
b |
将输入变量放入ebx |
|
c |
将输入变量放入ecx |
|
d |
将输入变量放入edx |
|
s |
将输入变量放入esi |
|
d |
将输入变量放入edi |
|
q |
将输入变量放入eax,ebx,ecx,edx中的一个 |
|
r |
将输入变量放入通用寄存器,也就是eax,ebx,ecx,edx,esi,edi中的一个 |
|
A |
把eax和edx合成一个64 位的寄存器(use long longs) |
|
内存 |
m |
内存变量 |
o |
操作数为内存变量,但是其寻址方式是偏移量类型,也即是基址寻址,或者是基址加变址寻址 |
|
V |
操作数为内存变量,但寻址方式不是偏移量类型 |
|
“” |
操作数为内存变量,但寻址方式为自动增量 |
|
p |
操作数是一个合法的内存地址(指针) |
|
寄存器或内存 |
g |
将输入变量放入eax,ebx,ecx,edx中的一个或者作为内存变量 |
X |
操作数可以是任何类型 |
|
立即数 |
I |
0-31之间的立即数(用于32位移位指令) |
J |
0-63之间的立即数(用于64位移位指令) |
|
N |
0-255之间的立即数(用于out指令) |
|
i |
立即数 |
|
n |
立即数,有些系统不支持除字以外的立即数,这些系统应该使用“n”而不是“i” |
|
匹配 |
0 |
表示用它限制的操作数与某个指定的操作数匹配, |
1 |
也即该操作数就是指定的那个操作数,例如“0” |
|
9 |
去描述“%1”操作数,那么“%1”引用的其实就是“%0”操作数,注意作为限定符字母的0-9 与指令中的“%0”-“%9”的区别,前者描述操作数,后者代表操作数。 |
|
& |
该输出操作数不能使用过和输入操作数相同的寄存器 |
|
操作数类型 |
= |
操作数在指令中是只写的(输出操作数) |
+ |
操作数在指令中是读写类型的(输入输出操作数) |
|
浮点数 |
f |
浮点寄存器 |
t |
第一个浮点寄存器 |
|
u |
第二个浮点寄存器 |
|
G |
标准的80387浮点常数 |
|
% |
该操作数可以和下一个操作数交换位置 例如addl的两个操作数可以交换顺序(当然两个操作数都不能是立即数) |
|
# |
部分注释,从该字符到其后的逗号之间所有字母被忽略 |
|
* |
表示如果选用寄存器,则其后的字母被忽略 |
官方参考资料:https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html#Extended-Asm
其他参考资料 https://blog.csdn.net/stefchu2012/article/details/79478411
https://www.cnblogs.com/latifrons/archive/2009/09/17/1568198.html