linux-2.6.22.6内核启动分析之head.S引导段代码

学习目标:

了解arch/arm/kernel/head.S作为内核启动的第一个文件所实现的功能!


前面通过对内核Makefile的分析,可以知道arch/arm/kernel/head.S是内核启动的第一个文件。另外,U-boot调用内核时,r1寄存器中存储“机器类型ID”,内核会使用它。

打开arch/arm/kernel/head.S文件,可以看到stext函数是内核入口函数,函数内容如下:

76     .section ".text.head", "ax"                             /* 定义一个.text.head段,段的属性a是允许段,x是可执行 */
77     .type    stext, %function                               /* 定义u-boot进入内核的入口函数 */
78 ENTRY(stext)                                                /* 入口地址stext函数 */
79     msr    cpsr_c,  #PSR_F_BIT | PSR_I_BIT | SVC_MODE       /* 关中断,设置CPU工作在管理模式 */
80
81 mrc p15, 0, r9, c0, c0 /* 获取CPU的ID */
82 bl __lookup_processor_type /* 调用函数,输入参数r9=cpuid,返回值r5=procinfo */
83 movs r10, r5 /* 不支持当前CPU,则返回值r5=0 */ 84 beq __error_p /* 如果r5=0,则打印错误 */ 85 bl __lookup_machine_type /* 调用函数,返回值r5=machinfo */
86 movs r8, r5 /* 不支持当前开发板,返回值r5=machinfo */ 87 beq __error_a /* 如果r5=0,则打印错误 */ 88 bl __create_page_tables /* 创建页表 */

先来大概介绍入口函数stext每条语句实现的功能,然后再详细分析__lookup_processor_type和__lookup_machine_type这两个函数:

第79行通过设置CPSR寄存器来确保处理器进入管理模式,并且禁止中断。

第81行读取协处理器CP15的寄存器C0获得CPU ID。

第82行调用__lookup_processor_type函数,检测内核是否支持当前CPU。如果支持,r5寄存器返回一个用来描述处理器结构的地址,否则r5的值为0。

第85行调用__lookup_machine_type函数,确定内核是否支持当前开发板。如果支持,r5寄存器返回一个用来描述这个开发板的结构的地址,否则r5的值为0。

如果__lookup_processor_type、__lookup_machine_type这两个函数中有一个返回值为0,则内核不能启动,如果配置内核时使能了CONFIG_DEBUG_LL,还会打印错误提示信息。


在介绍__lookup_processor_type和__lookup_machine_type这两个函数之前,还要先插讲一些内容。我们在前面简要的说过__lookup_processor_type和__lookup_machine_type这两个函数分别是用来检测内核是否支持当前架构的处理器、是否支持当前开发板,如果内核想实现检测功能,那么内核中一定会存放自己所支持的处理器架构信息以及所支持的开发板信息,下面先来找到内核中这些信息是如何被定义的。

内核中,定义了若干个pro_info_list结构,表示它所支持的CPU。对于ARM架构的CPU,这些结构体的源码在arch/arm/mm/目录下,例如proc-arm920.S中的如下代码,它表示arm920架构CPU的pro_info_list结构。

448     .section ".proc.info.init", #alloc, #execinstr
449 
450     .type    __arm920_proc_info,#object
451 __arm920_proc_info:
452     .long    0x41009200             /* cpu val */
453     .long    0xff00fff0             /* cpu mask */

内核所支持每个处理器架构都有自己的pro_info_list结构体用来保存自己CPU信息,这些不同处理器使用的pro_info_list结构体都被强制定义在“.proc_info_init”段中。在连接内核时,这些结构体被组织在一起,起始地址为__proc_info_begin,结束地址为__proc_info_end。可以从连接脚本arch/arm/kernel/vmlinux.lds中看出来。

35    __proc_info_begin = .;          #.proc_info_init段起始地址(连接程序是动态确定)
36      *(.proc.info.init)
37    __proc_info_end = .;            #.proc_info_init结束地址(连接程序时动态确定)

再来看内核中支持开发板信息内容,是如何被定义和存放的。内核中对于每种所支持的开发板都会使用宏MACHINE_START、MACHINE_END来定义一个machine_desc结构,这个结构定义了开发板相关的一些属性和函数,比如机器ID、起始I/O物理地址、Bootloader传入参数的地址、中断初始化函数等等。例如SMDK2410开发板,在arch/arm/mach-sc32410/mach-smdk2410.c中定义。

198 MACHINE_START(SMDK2410, "SMDK2410") /* @TODO: request a new identifier and switch
199                     * to SMDK2410 */
200     /* Maintainer: Jonas Dietsche */
201     .phys_io    = S3C2410_PA_UART,
202     .io_pg_offst    = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,
203     .boot_params    = S3C2410_SDRAM_PA + 0x100,
204     .map_io        = smdk2410_map_io,
205     .init_irq    = s3c24xx_init_irq,
206     .init_machine    = smdk2410_init,
207     .timer        = &s3c24xx_timer,
208 MACHINE_END

在内核的include/asm/-arm/mach/arch.h文件中找到第198、202行的宏MACHINE_START、MACHINE_END定义,这两个宏定义如下:

50 #define MACHINE_START(_type,_name)            \
51 static const struct machine_desc __mach_desc_##_type    \
52  __used                            \
53  __attribute__((__section__(".arch.info.init"))) = {    \
54     .nr        = MACH_TYPE_##_type,        \
55    .name        = _name,
56 
57 #define MACHINE_END                \
58 };

 按照上述宏定义,将198行~208行代码展开如下所示:

static const struct machine_desc __mach_desc_SMDK2410    \
 __used                            \
 __attribute__((__section__(".arch.info.init"))) = {    \
    .nr        = MACH_TYPE_SMDK2410,        \
    .name        = "SMDK2410",
        .phys_io    = S3C2410_PA_UART,
    .io_pg_offst    = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,
    .boot_params    = S3C2410_SDRAM_PA + 0x100,
    .map_io        = smdk2410_map_io,
    .init_irq    = s3c24xx_init_irq,
    .init_machine    = smdk2410_init,
    .timer        = &s3c24xx_timer,
};

将198~208行的代码展开,可以看出这段内容定义了一个静态常量的machine_desc类型结构体__mach_desc_SMDK2410。其中的MACH_TYPE_SMDK2410在arch/arm/tools/mach-types中定义,最后这个文件会被转换成一个头文件include/asm/arm/mach-type.h被其它文件包含。machine_des结构体在include/asm-arm/mach/arch.h文件中定义。__attribute__((__section__(".arch.info.init")))语句表示将所有的machine_desc结构都存放在“.arch.info.init”段中,在连接内核时,它们被组织到一起,开始地址为__arch_info_begin,结束地址为__arch_info_end。可以从连接脚本arch/arm/kernel/vmlinux.lds中看出来。 

38   __arch_info_begin = .;                #.arch.info.init段起始地址(连接时动态确定)
39     *(.arch.info.init)
40   __arch_info_end = .;                  #.arch.info.init段结束地址(连接时动态确定)

有了上面的插讲内容作为铺垫,下面对 __lookup_processor_type和__lookup_machine_type这两个函数如何去实现各自功能理解就会更加方便了。先来看 __lookup_processor_type函数,在arch/arm/kernel/head-common.S文件中定义如下:

145     .type    __lookup_processor_type, %function
146 __lookup_processor_type:
147     adr    r3, 3f
148     ldmda  r3, {r5 - r7}
149     sub    r3, r3, r7            @ get offset between virt&phys
150     add    r5, r5, r3            @ convert virt addresses to
151     add    r6, r6, r3            @ physical address space
152 1:  ldmia    r5, {r3, r4}            @ value, mask
153     and    r4, r4, r9            @ mask wanted bits
154     teq    r3, r4
155     beq    2f
156     add    r5, r5, #PROC_INFO_SZ        @ sizeof(proc_info_list)
157     cmp    r5, r6
158     blo    1b
159     mov    r5, #0                @ unknown processor
160 2:  mov    pc, lr
176     .long    __proc_info_begin
177     .long    __proc_info_end
178 3:  .long    .
179     .long    __arch_info_begin
180     .long    __arch_info_end

在调用__enable_mmu函数之前使用的都是物理地址,而内核却以虚拟地址链接的。所以在访问pro_info_list结构之前,先将它的虚拟地址转换为物理地址,上面代码的147行~151行就是实现上述的转换。

第147行先获得178行物理地址。adr指令基于pc寄存器计算地址,此时MMU功能关闭,PC寄存器中使用的还是物理地址,所以执行“adr r3,3f”后,r3内存放的是178行代码的物理地址, 指令中的3f的f是forward的意思,意思是跳到程序的后面(往下)。

第148行用来获取第176行~178行定义的数据:__proc_info_begin、__pro_info_end和"."。前两个变量是在连接内核时确定,它们是虚拟地址,在前面插讲中我们对这__proc_info_begin、__pro_info_end已经做出了详细介绍,"."表示当前的代码在编译链接后的虚拟地址。ldmda r3, {r5-r7}指令,从源地址[r3]读取4个字节数据放到寄存器中,每读一次r3-4,而指令执行后r3内容不变,数据存放到寄存器规则是低地址对于低寄存器编号,高地址对于高寄存器编号。

第149行计算物理地址和虚拟地址的差值,第150~151根据这个差值计算__pro_info_begin、__pro_info_end的物理地址。

下面的代码一次读取存放在“.proc_info_init”段中每个cpu架构的pro_info_list结构体前面两个成员,判断cpu_val是否等于r9&cpu_mask,r9是读取head.S中获取的CPU ID.如果比较相等,则表示内核支持当前CPU,直接返回这个结构地址。如果“.proc_info_init”段所有pro_info_list结构都不支持这个CPU,则返回0。

第160行是子函数调用返回语句。

接着再来分析__lookup_machine_type这个函数,同样的这个函数也在在arch/arm/kernel/head-common.S文件中定义,其代码如下所示:

193     .type    __lookup_machine_type, %function
194 __lookup_machine_type:
195     adr    r3, 3b                     @address of 3b, Physical address
196     ldmia    r3, {r4, r5, r6}   @r4="." virtual address of 3b,r5=__arch_info_begin ,r6=__arch_info_end
197     sub    r3, r3, r4            @ get offset between virt&phys
198     add    r5, r5, r3            @ convert virt addresses to
199     add    r6, r6, r3            @ physical address space
200 1:  ldr    r3, [r5, #MACHINFO_TYPE]    @ get machine type
201     teq    r3, r1                @ matches loader number?
202     beq    2f                @ found
203     add    r5, r5, #SIZEOF_MACHINE_DESC    @ next machine_desc
204     cmp    r5, r6
205     blo    1b
206     mov    r5, #0                @ unknown machine
207 2:  mov    pc, lr

第195行先获得178行物理地址。adr指令基于pc寄存器计算地址,此时MMU功能关闭,PC寄存器中使用的还是物理地址,所以执行“adr r3,3f”后,r3内存放的是178行代码的物理地址, 指令中的3b的b是backward的意思,意思是跳到程序的前面(往上)。

第196行用来获取第178行~180行定义的数据:__arch_info_begin、__arch_info_end和"."。前两个变量都是在连接内核时确定,它们是虚拟地址,在前面插讲中我们对这__arch_info_begin、__arch_info_end已经做出了详细介绍,"."表示当前的代码在编译链接后的虚拟地址。ldmia r3, {r5-r7}指令,从源地址[r3]读取4个字节数据放到寄存器中,每读一次r3+4,而指令执行后r3内容不变,数据存放到寄存器规则是低地址对于低寄存器编号,高地址对于高寄存器编号。

第197行计算物理地址和虚拟地址的差值,第198~199行根据这个差值计算__arch_info_begin、__arch_info_end的物理地址。

下面的代码读取存放在“.arch_info_init”段中每个machine_des结构体机器类型ID,判断uboot传入机器ID(通过r1寄存器传入)是否等于内核中存放的不同machine_des结构体的机器类型ID。如果比较相等,则表示内核支持当前开发板,直接返回这个结构地址。如果“.arch_info_init”段所有存放machine_des结构都不支持这个开发板,则返回0。

第207行是子函数调用返回语句。


如果__lookup_processor_type和__lookup_machine_type函数都返回成功,则head.S后续引导代码将继续执行。其中的__create_page_table函数用来创建以及页表以建立虚拟地址到物理地址的映射关系,它用到__lookup_processer_type函数返回的proc_info_list结构。同时在引导阶段还会使能mmu,最后调用start_kernel函数进入内核启动第二阶段。

总结:引导阶段代码做了以下内容
1、首先检查内核是否支持当前架构处理器,然后检测是否支持当前开发板,若支持执行后续操作。
2、设置页表、使能MMU
3、执行调用C函数start_kernel之前的常规工作,包括复制数据段、清除BSS段等

猜你喜欢

转载自www.cnblogs.com/053179hu/p/9289106.html
今日推荐