qemu源码分析

参考:http://lists.gnu.org/archive/html/qemu-devel/2011-04/pdfhC5rVdz7U8.pdf

1. qemu与Bochs的区别:

1. Bochs

Bochs和qemu都是以软件仿真为主的虚拟软件,二者的区别何在?

Bochs完全是以软件的方式对目标程序(OS以及运行在其上的应用程序)进行仿真。Bochs在自己的内部维护着CPU、内存、IO设备的数据结构,每当Bochs仿真一条指令,就会按照这条指令在真实硬件上运行时应当产生的效果,对这些软件维护硬件数据结构产生相应的影响。

这种逐条处理的方式,可以保持与真实运行时完全相同的粒度,便于学习和调试。但是由于这是一种一对多的映射方式,即一条机制指令,会被解释成N条指令执行,因此效率的下降是在所难免。

2. qemu

qemu采取的是另外一种粒度的仿真。

qemu会从目标程序中,截取当前需要运行的一段代码(被称作Translation Block),将这段代码先翻译成中间语言(Intermediate Code),再将中间语言翻译成主机体系相关的二进制代码。

由于Translation Block的粒度大于单条机制指令的粒度,qemu相当于是batch处理指令的仿真操作的,因此会比逐条处理的Bochs性能上快一些。

除此之外,qemu还会优化对于Translation Block的缓存,以及将多个连接执行的Translation Block链接起来在同一批次进行处理;这两种方式对于反复执行的代码段的仿真性能有很大的提升。

3. 总结

简而言之,Bochs适合用于学习,以及比较简单的任务处理,Bochs自带的调试器也很给力,用Bochs调试Linux内核是不错的选择(可以参考:http://www.cnblogs.com/long123king/p/3559816.html等等),但是Bochs不适合用于真实地仿真大型的操作系统,比如Windows,基本上无法做到。

qemu由于处理方式上有优化,不像Bochs那样可以“原汁原味”地展现指令级别的执行过程,因此不太适合于学习;但是由于qemu性能上的提升,还可以配合内核虚拟化模块kvm,甚至xen,因此qemu可以像主流的虚拟桌面软件(VirtualBox, Vmware等等)一样流畅地运行多种操作系统。如果你需要在Linux上面虚拟化Windows,肯定是qemu更加适合一些。

tb_find_fast: 查找下一个TB(Translation Block),并且生成主机代码;

tcg_qemu_tb_exec:执行生成的主机代码,主机代码由三部分组成:

2. qemu的处理流程

qemu的仿真主循环位于cpu-exec.c:cpu_exec函数中

for(;;)
{
......
tb = tb_find_fast(env);
......
next_tb = cpu_tb_exec(cpu, tc_ptr);
......
}

1. tb_find_fast:

用来准备Translation Block;如果缓存中已经准备好的Translation Block,就直接返回;否则调用tb_find_slow函数来构造一个新的TB。

tb_find_fast
    |
tb_find_slow
    |
tb_gen_code
    |
cpu_gen_code
    |
gen_intermediate_code 【Guest Code --> tcg op(中间代码)】
    |
tcg_gen_code【tcg op(中间代码) --> Host Code】
 

其中,gen_intermediate_code是与体系相关的函数实现,x86的实现位于target-i386/translate.c中,内部调用disas_insn逐条指令处理。

而tcg_gen_code会调用tcg_gen_code_common,从TB中取出中间代码,将其转换成主机代码。

2. cpu_tb_exec:

用来执行生成好的TB。

cpu_tb_exec
    |
tcg_qemu_tb_exec
#define tcg_qemu_tb_exec(tb_ptr) ((long REGPARM (*)(void *))code_gen_prologue)(tb_ptr)

prologue和epilogue是compiler在生成目标代码时,对函数栈帧的保存与恢复的代码,我们信手拈来一个例子

objdump -d vl.o

下面代码中红色的部分就分别是函数的prologue和epilogue。

000000000000013a <bitmap_empty>:
     13a:       55                      
     13b:       48 89 e5               
     13e:       53                      
     13f:       48 83 ec 28             
     143:       48 89 7d d8             mov    %rdi,-0x28(%rbp)
     147:       89 75 d4                mov    %esi,-0x2c(%rbp)
     14a:       64 48 8b 04 25 28 00    mov    %fs:0x28,%rax
     151:       00 00 
     153:       48 89 45 e8             mov    %rax,-0x18(%rbp)
     157:       31 c0                   xor    %eax,%eax
     159:       8b 45 d4                mov    -0x2c(%rbp),%eax
     15c:       83 f8 40                cmp    $0x40,%eax
     15f:       77 42                   ja     1a3 <bitmap_empty+0x69>
     161:       48 8b 45 d8             mov    -0x28(%rbp),%rax
     165:       48 8b 10                mov    (%rax),%rdx
     168:       8b 45 d4                mov    -0x2c(%rbp),%eax
     16b:       48 98                   cltq   
     16d:       83 e0 3f                and    $0x3f,%eax
     170:       48 85 c0                test   %rax,%rax
     173:       74 19                   je     18e <bitmap_empty+0x54>
     175:       8b 45 d4                mov    -0x2c(%rbp),%eax
     178:       83 e0 3f                and    $0x3f,%eax
     17b:       be 01 00 00 00          mov    $0x1,%esi
     180:       89 c1                   mov    %eax,%ecx
     182:       48 d3 e6                shl    %cl,%rsi
     185:       48 89 f0                mov    %rsi,%rax
     188:       48 83 e8 01             sub    $0x1,%rax
     18c:       eb 07                   jmp    195 <bitmap_empty+0x5b>
     18e:       48 c7 c0 ff ff ff ff    mov    $0xffffffffffffffff,%rax
     195:       48 21 d0                and    %rdx,%rax
     198:       48 85 c0                test   %rax,%rax
     19b:       0f 94 c0                sete   %al
     19e:       0f b6 c0                movzbl %al,%eax
     1a1:       eb 11                   jmp    1b4 <bitmap_empty+0x7a>
     1a3:       8b 55 d4                mov    -0x2c(%rbp),%edx
     1a6:       48 8b 45 d8             mov    -0x28(%rbp),%rax
     1aa:       89 d6                   mov    %edx,%esi
     1ac:       48 89 c7                mov    %rax,%rdi
     1af:       e8 00 00 00 00          callq  1b4 <bitmap_empty+0x7a>
     1b4:       48 8b 5d e8             mov    -0x18(%rbp),%rbx
     1b8:       64 48 33 1c 25 28 00    xor    %fs:0x28,%rbx
     1bf:       00 00 
     1c1:       74 05                   je     1c8 <bitmap_empty+0x8e>
     1c3:       e8 00 00 00 00          callq  1c8 <bitmap_empty+0x8e>
     1c8:       48 83 c4 28             
     1cc:       5b                      
     1cd:       5d                      
     1ce:       c3                      retq  

qemu的执行流程中,本来属于qemu的代码,我们可以称之为static code;而通过TB生成的主机代码,我们可以称之为dynamic code,因此必定要有一个入口点,让static code将dynamic code调用起来。qemu采用的是类似函数prologue的方式,这也是为什么我们会看到code_gen_prologue的原因。

code_gen_prologure指向的是TB中动态生成的相对于整个TB的prologue。

 

转载于:https://www.cnblogs.com/long123king/p/3584053.html

猜你喜欢

转载自blog.csdn.net/weixin_34253126/article/details/94503645