嵌入式Linux26内核启动流程.docx
《嵌入式Linux26内核启动流程.docx》由会员分享,可在线阅读,更多相关《嵌入式Linux26内核启动流程.docx(17页珍藏版)》请在冰点文库上搜索。
嵌入式Linux26内核启动流程
Linux内核构成
(国嵌)
Linux/arch/arm/boot/compressed/head.s
1.解压缩
2.初始化
3.启动应用程序
1arch/arm/boot/compressed/Makefilearch/arm/boot/compressed/vmlinux.lds
2.arch/arm/kernel/vmlinux.lds
Linux内核启动流程
(国嵌)
arch/arm/boot/compressed/start.S(head.s—负责解压缩)
Start:
.typestart,#function
.rept8
movr0,r0
.endr
b1f
.word0x016f2818@Magicnumberstohelptheloader
.wordstart@absoluteload/runzImageaddress
.word_edata@zImageendaddress
1:
movr7,r1@savearchitectureID
movr8,r2@saveatagspointer
这也标志着u-boot将系统完全的交给了OS,bootloader生命终止。
之后代码在133行会读取cpsr并判断是否处理器处于supervisor模式——从u-boot进入kernel,系统已经处于SVC32模式;而利用angel进入则处于user模式,还需要额外两条指令。
之后是再次确认中断关闭,并完成cpsr写入
mrsr2,cpsr@getcurrentmode
tstr2,#3@notuser?
bnenot_angel
movr0,#0x17@angel_SWIreason_EnterSVC
swi0x123456@angel_SWI_ARM
not_angel:
mrsr2,cpsr@turnoffinterruptsto
orrr2,r2,#0xc0@preventangelfromrunning
msrcpsr_c,r2
然后在LC0地址处将分段信息导入r0-r6、ip、sp等寄存器,并检查代码是否运行在与链接时相同的目标地址,以决定是否进行处理。
由于现在很少有人不使用loader和tags,将zImage烧写到rom直接从0x0位置执行,所以这个处理是必须的(但是zImage的头现在也保留了不用loader也可启动的能力)。
arm架构下自解压头一般是链接在0x0地址而被加载到0x30008000运行,所以要修正这个变化。
涉及到
r5寄存器存放的zImage基地址
r6和r12(即ip寄存器)存放的got(globaloffsettable)
r2和r3存放的bss段起止地址
sp栈指针地址
很简单,这些寄存器统统被加上一个你也能猜到的偏移地址0x30008000。
该地址是s3c2410相关的,其他的ARM处理器可以参考下表
PXA2xx是0xa0008000
IXP2x00和IXP4xx是0x00008000
Freescalei.MX31/37是0x80008000
TIdavinciDM64xx是0x80008000
TIomap系列是0x80008000
AT91RM/SAM92xx系列是0x20008000
CirrusEP93xx是0x00008000
这些操作发生在代码172行开始的地方,下面只粘贴一部分
addr5,r5,r0
addr6,r6,r0
addip,ip,r0
后面在211行进行bss段的清零工作
not_relocated:
movr0,#0
1:
strr0,[r2],#4@clearbss
strr0,[r2],#4
strr0,[r2],#4
strr0,[r2],#4
cmpr2,r3
blo1b
然后224行,打开cache,并为后面解压缩设置64KB的临时malloc空间
blcache_on
movr1,sp@mallocspaceabovestack
addr2,sp,#0x10000@64kmax接下来238行进行检查,确定内核解压缩后的Image目标地址是否会覆盖到zImage头,如果是则准备将zImage头转移到解压出来的内核后面
cmpr4,r2
bhswont_overwrite
subr3,sp,r5@>compressedkernelsize
addr0,r4,r3,lsl#2@allowfor4xexpansion
cmpr0,r5
blswont_overwrite
movr5,r2@decompressaftermallocspace
movr0,r5
movr3,r7
bldecompress_kernel
真实情况——在大多数的应用中,内核编译都会把压缩的zImage和非压缩的Image链接到同样的地址,s3c2410平台下即是0x30008000。
这样做的好处是,人们不用关心内核是Image还是zImage,放到这个位置执行就OK,所以在解压缩后zImage头必须为真正的内核让路。
在250行解压完毕,内核长度返回值存放在r0寄存器里。
在内核末尾空出128字节的栈空间用,并且使其长度128字节对齐。
addr0,r0,#127+128@alignment+stack
bicr0,r0,#127@alignthekernellength
算出搬移代码的参数:
计算内核末尾地址并存放于r1寄存器,需要搬移代码原来地址放在r2,需要搬移的长度放在r3。
然后执行搬移,并设置好sp指针指向新的栈(原来的栈也会被内核覆盖掉)
addr1,r5,r0@endofdecompressedkernel
adrr2,reloc_start
ldrr3,LC1
addr3,r2,r3
1:
ldmiar2!
{r9-r14}@copyrelocationcode
stmiar1!
{r9-r14}
ldmiar2!
{r9-r14}
stmiar1!
{r9-r14}
cmpr2,r3
blo1b
addsp,r1,#128@relocatethestack
搬移完成后刷新cache,因为代码地址变化了不能让cache再命中被内核覆盖的老地址。
然后跳转到新的地址继续执行
blcache_clean_flush
addpc,r5,r0@callrelocationcode
注意——zImage在解压后的搬移和跳转会给gdb调试内核带来麻烦。
因为用来调试的符号表是在编译是生成的,并不知道以后会被搬移到何处去,只有在内核解压缩完成之后,根据计算出来的参数“告诉”调试器这个变化。
以撰写本文时使用的zImage为例,内核自解压头重定向后,reloc_start地址由0x30008360变为0x30533e60。
故我们要把vmlinux的符号表也相应的从0x30008000后移到0x30533b00开始,这样gdb就可以正确的对应源代码和机器指令。
随着头部代码移动到新的位置,不会再和内核的目标地址冲突,可以开始内核自身的搬移了。
此时r0寄存器存放的是内核长度(严格的说是长度外加128Byte的栈),r4存放的是内核的目的地址0x30008000,r5是目前内核存放地址,r6是CPUID,r7是machineID,r8是atags地址。
代码从501行开始
reloc_start:
addr9,r5,r0
subr9,r9,#128@donotcopythestack
debug_reloc_start
movr1,r4
1:
.rept4
ldmiar5!
{r0,r2,r3,r10-r14}@relocatekernel
stmiar1!
{r0,r2,r3,r10-r14}
.endr
cmpr5,r9
blo1b
addsp,r1,#128@relocatethestack
接下来在516行清除并关闭cache,清零r0,将machineID存入r1,atags指针存入r2,再跳入0x30008000执行真正的内核Image
call_kernel:
blcache_clean_flush
blcache_off
movr0,#0@mustbezero
movr1,r7@restorearchitecturenumber
movr2,r8@restoreatagspointer
movpc,r4@callkernel
内核代码入口在arch/arm/kernel/head.S文件的83行。
首先进入SVC32模式,并查询CPUID,检查合法性
msrcpsr_c,#PSR_F_BIT|PSR_I_BIT|SVC_MODE@ensuresvcmode
@andirqsdisabled
mrcp15,0,r9,c0,c0@getprocessorid
bl__lookup_processor_type@r5=procinfor9=cpuid
movsr10,r5@invalidprocessor(r5=0)?
beq__error_p@yes,error'p'
接着在87行进一步查询machineID并检查合法性
bl__lookup_machine_type@r5=machinfo
movsr8,r5@invalidmachine(r5=0)?
beq__error_a@yes,error'a'
其中__lookup_processor_type在linux-2.6.24-moko-linuxbj/arch/arm/kernel/head-common.S文件的149行,该函数首将标号3的实际地址加载到r3,然后将编译时生成的__proc_info_begin虚拟地址载入到r5,__proc_info_end虚拟地址载入到r6,标号3的虚拟地址载入到r7。
由于adr伪指令和标号3的使用,以及__proc_info_begin等符号在linux-2.6.24-moko-linuxbj/arch/arm/kernel/vmlinux.lds而不是代码中被定义,此处代码不是非常直观,想弄清楚代码缘由的读者请耐心阅读这两个文件和adr伪指令的说明。
r3和r7分别存储的是同一位置标号3的物理地址(由于没有启用mmu,所以当前肯定是物理地址)和虚拟地址,所以儿者相减即得到虚拟地址和物理地址之间的offset。
利用此offset,将r5和r6中保存的虚拟地址转变为物理地址
__lookup_processor_type:
adrr3,3f
ldmdar3,{r5-r7}
subr3,r3,r7@getoffsetbetweenvirt&phys
addr5,r5,r3@convertvirtaddressesto
addr6,r6,r3@physicaladdressspace
然后从proc_info中读出内核编译时写入的processorID和之前从cpsr中读到的processorID对比,查看代码和CPU硬件是否匹配(想在arm920t上运行为cortex-a8编译的内核?
不让!
)。
如果编译了多种处理器支持,如versatile板,则会循环每种type依次检验,如果硬件读出的ID在内核中找不到匹配,则r5置0返回
1:
ldmiar5,{r3,r4}@value,mask
andr4,r4,r9@maskwantedbits
teqr3,r4
beq2f
addr5,r5,#PROC_INFO_SZ@sizeof(proc_info_list)
cmpr5,r6
blo1b
movr5,#0@unknownprocessor
2:
movpc,lr
__lookup_machine_type在linux-2.6.24-moko-linuxbj/arch/arm/kernel/head-common.S文件的197行,编码方法与检查processorID完全一样,请参考前段
__lookup_machine_type:
adrr3,3b
ldmiar3,{r4,r5,r6}
subr3,r3,r4@getoffsetbetweenvirt&phys
addr5,r5,r3@convertvirtaddressesto
addr6,r6,r3@physicaladdressspace
1:
ldrr3,[r5,#MACHINFO_TYPE]@getmachinetype
teqr3,r1@matchesloadernumber?
beq2f@found
addr5,r5,#SIZEOF_MACHINE_DESC@nextmachine_desc
cmpr5,r6
blo1b
movr5,#0@unknownmachine
2:
movpc,lr
代码回到head.S第92行,检查atags合法性,然后创建初始页表
bl__vet_atags
bl__create_page_tables
创建页表的代码在218行,首先将内核起始地址-0x4000到内核起始地址之间的16K存储器清0
__create_page_tables:
pgtblr4@pagetableaddress
/*
*Clearthe16Klevel1swapperpagetable
*/
movr0,r4
movr3,#0
addr6,r0,#0x4000
1:
strr3,[r0],#4
strr3,[r0],#4
strr3,[r0],#4
strr3,[r0],#4
teqr0,r6
bne1b
然后在234行将proc_info中的mmu_flags加载到r7
ldrr7,[r10,#PROCINFO_MM_MMUFLAGS]@mm_mmuflags在242行将PC指针右移20位,得到内核第一个1MB空间的段地址存入r6,在s3c2410平台该值是0x300。
接着根据此值存入映射标识
movr6,pc,lsr#20@startofkernelsection
orrr3,r7,r6,lsl#20@flags+kernelbase
strr3,[r4,r6,lsl#2]@identitymapping
完成页表设置后回到102行,为打开虚拟地址映射作准备。
设置sp指针,函数返回地址lr指向__enable_mmu,并跳转到linux-2.6.24-moko-linuxbj/arch/arm/mm/proc-arm920.S的386行,清除I-cache、D-cache、writebuffer和TLB
__arm920_setup:
movr0,#0
mcrp15,0,r0,c7,c7@invalidateI,Dcachesonv4
mcrp15,0,r0,c7,c10,4@drainwritebufferonv4
#ifdefCONFIG_MMU
mcrp15,0,r0,c8,c7@invalidateI,DTLBsonv4
#endif然后返回head.S的158行,加载domain和页表,跳转到__turn_mmu_on
__enable_mmu:
#ifdefCONFIG_ALIGNMENT_TRAP
orrr0,r0,#CR_A
#else
bicr0,r0,#CR_A
#endif
#ifdefCONFIG_CPU_DCACHE_DISABLE
bicr0,r0,#CR_C
#endif
#ifdefCONFIG_CPU_BPREDICT_DISABLE
bicr0,r0,#CR_Z
#endif
#ifdefCONFIG_CPU_ICACHE_DISABLE
bicr0,r0,#CR_I
#endif
movr5,#(domain_val(DOMAIN_USER,DOMAIN_MANAGER)|\
domain_val(DOMAIN_KERNEL,DOMAIN_MANAGER)|\
domain_val(DOMAIN_TABLE,DOMAIN_MANAGER)|\
domain_val(DOMAIN_IO,DOMAIN_CLIENT))
mcrp15,0,r5,c3,c0,0@loaddomainaccessregister
mcrp15,0,r4,c2,c0,0@loadpagetablepointer
b__turn_mmu_on在194行把mmu使能位写入mmu,激活虚拟地址。
然后将原来保存在sp中的地址载入pc,跳转到head-common.S的__mmap_switched,至此代码进入虚拟地址的世界
movr0,r0
mcrp15,0,r0,c1,c0,0@writecontrolreg
mrcp15,0,r3,c0,c0,0@readidreg
movr3,r3
movr3,r3
movpc,r13
在head-common.S的37行开始清除内核bss段,processorID保存在r9,machineID报存在r1,atags地址保存在r2,并将控制寄存器保存到r7定义的内存地址。
接下来跳入linux-2.6.24-moko-linuxbj/init/main.c的507行,start_kernel函数。
这里只粘贴部分代码(第一个C语言函数,作一系列的初始化)
__mmap_switched:
adrr3,__switch_data+4
ldmiar3!
{r4,r5,r6,r7}
cmpr4,r5@Copydatasegmentifneeded
1:
cmpner5,r6
ldrnefp,[r4],#4
strnefp,[r5],#4
bne1b
asmlinkagevoid__initstart_kernel(void)
{
char*command_line;
externstructkernel_param__start___param[],__stop___param[];
smp_setup_processor_id();
/*
*Needtorunasearlyaspossible,toinitializethe
*lockdephash:
*/
lockdep_init();
debug_objects_early_init();
cgroup_init_early();
local_irq_disable();
early_boot_irqs_off();
early_init_irq_lock_class();
/*
*Interruptsarestilldisabled.Donecessarysetups,then
*enablethem
*/
lock_kernel();
tick_init();
boot_cpu_init();
page_address_init();
printk(KERN_NOTICE);
printk(linux_banner);
setup_arch(&command_line);
mm_init_owner(&init_mm,&init_task);
setup_command_line(command_line);
setup_per_cpu_areas();
setup_nr_cpu_ids();
smp_prepare_boot_cpu();/*arch-specificboot-cpuhooks*/
/*
*Setuptheschedulerpriorstartinganyinterrupts(suchasthe
*timerinterrupt).Fulltopologysetuphappensatsmp_init()
*time-butmeanwhilewestillhaveafunctioningscheduler.
*/
sched_init();
/*
*Disablepreemption-earlybootupschedulingisextremely
*fragileuntilwecpu_idle()forthefirsttime.
*/
preempt_disable();
build_all_zonelists();
page_alloc_init();
printk(KERN_NOTICE"Kernelcommandline:
%s\n",boot_command_line);
parse_early_param();
parse_args("Bootingkernel",static_command_line,__start___param,
__stop___param-__start___param,
&unknown_bootoption);
if(!
irqs_disabled()){
printk(KERN_WARNING"start_kernel():
bug:
interruptswere"
"enabled*very*early,fixingit\n");
local_irq