1. 程式人生 > >第3階段——內核啟動分析之start_kernel初始化函數(5)

第3階段——內核啟動分析之start_kernel初始化函數(5)

本質 aware 字符 信息 異常 性能 ack ifdef 取數

內核啟動分析之start_kernel初始化函數(init/main.c)

stext函數啟動內核後,就開始進入start_kernel初始化各個函數, 下面只是淺嘗輒止的描述一下函數的功能,很多函數真正理解需要對linux相關體系有很深的了解後才能明白

代碼如下:

asmlinkage void __init start_kernel(void)

{

char * command_line;

extern struct kernel_param __start___param[], __stop___param[];

smp_setup_processor_id(); //來設置smp process id,當然目前看到的代碼裏面這裏是空的

unwind_init();

//lockdep是linux內核的一個調試模塊,用來檢查內核互斥機制尤其是自旋鎖潛在的死鎖問題。

//自旋鎖由於是查詢方式等待,不釋放處理器,比一般的互斥機制更容易死鎖,

//故引入lockdep檢查以下幾種情況可能的死鎖(lockdep將有專門的文章詳細介紹,在此只是簡單列舉):

//

//·同一個進程遞歸地加鎖同一把鎖;

//

//·一把鎖既在中斷(或中斷下半部)使能的情況下執行過加鎖操作,

// 又在中斷(或中斷下半部)裏執行過加鎖操作。這樣該鎖有可能在鎖定時由於中斷發生又試圖在同一處理器上加鎖;

//

//·加鎖後導致依賴圖產生成閉環,這是典型的死鎖現象。

lockdep_init();

//關閉當前CUP中斷

local_irq_disable();

//修改標記early_boot_irqs_enabled;

//通過一個靜態全局變量 early_boot_irqs_enabled來幫助我們調試代碼,

//通過這個標記可以幫助我們知道是否在”early bootup code”,也可以通過這個標誌警告是有無效的終端打開

early_boot_irqs_off();

//每一個中斷都有一個IRQ描述符(struct irq_desc)來進行描述。

//這個函數的主要作用是設置所有的 IRQ描述符(struct irq_desc)的鎖是統一的鎖,

//還是每一個IRQ描述符(struct irq_desc)都有一個小鎖。

early_init_irq_lock_class();

/*

* Interrupts are still disabled. Do necessary setups, then

* enable them

*/

// 大內核鎖(BKL--Big Kernel Lock)

//大內核鎖本質上也是自旋鎖,但是它又不同於自旋鎖,自旋鎖是不可以遞歸獲得鎖的,因為那樣會導致死鎖。

//但大內核鎖可以遞歸獲得鎖。大內核鎖用於保護整個內核,而自旋鎖用於保護非常特定的某一共享資源。

//進程保持大內核鎖時可以發生調度,具體實現是:

//在執行schedule時,schedule將檢查進程是否擁有大內核鎖,如果有,它將被釋放,以致於其它的進程能夠獲得該鎖,

//而當輪到該進程運行時,再讓它重新獲得大內核鎖。註意在保持自旋鎖期間是不運行發生調度的。

//需要特別指出,整個內核只有一個大內核鎖,其實不難理解,內核只有一個,而大內核鎖是保護整個內核的,當然有且只有一個就足夠了。

//還需要特別指出的是,大內核鎖是歷史遺留,內核中用的非常少,一般保持該鎖的時間較長,因此不提倡使用它。

//從2.6.11內核起,大內核鎖可以通過配置內核使其變得可搶占(自旋鎖是不可搶占的),這時它實質上是一個互斥鎖,使用信號量實現。

//大內核鎖的API包括:

//

//void lock_kernel(void);

//

//該函數用於得到大內核鎖。它可以遞歸調用而不會導致死鎖。

//

//void unlock_kernel(void);

//

//該函數用於釋放大內核鎖。當然必須與lock_kernel配對使用,調用了多少次lock_kernel,就需要調用多少次unlock_kernel。

//大內核鎖的API使用非常簡單,按照以下方式使用就可以了:

//lock_kernel(); //對被保護的共享資源的訪問 … unlock_kernel();

//http://blog.csdn.net/universus/archive/2010/05/25/5623971.aspx

lock_kernel();

//初始化time ticket,時鐘

tick_init();

//函數 tick_init() 很簡單,調用 clockevents_register_notifier 函數向 clockevents_chain 通知鏈註冊元素:

// tick_notifier。這個元素的回調函數指明了當時鐘事件設備信息發生變化(例如新加入一個時鐘事件設備等等)時,

//應該執行的操作,該回調函數為 tick_notify

//http://blogold.chinaunix.net/u3/97642/showart_2050200.html

boot_cpu_init();

//初始化頁地址,當然對於arm這裏是個空函數

//http://book.chinaunix.net/special/ebook/PrenticeHall/PrenticeHallPTRTheLinuxKernelPrimer/0131181637/ch08lev1sec5.html

page_address_init();

/*打印KER_NOTICE,這裏的KER_NOTICE是字符串<5>*/

printk(KERN_NOTICE);

/*打印以下linux版本信息:

“Linux version 2.6.22.6 ([email protected]) (gcc version 3.4.5) #1 Fri Jun 16 00:55:53 CST 2017” */

printk(linux_banner);

//系結構相關的內核初始化過程,處理uboot傳遞進來的atag參數( setup_memory_tags()和setup_commandline _tags() )

//http://www.cublog.cn/u3/94690/showart_2238008.html

setup_arch(&command_line);

//處理啟動命令,這裏就是設置的cmd_line,

//保存未改變的comand_line到字符數組static_command_line[] 中。

//保存 boot_command_line到字符數組saved_command_line[]中

setup_command_line(command_line);

unwind_setup();

//如果沒有定義CONFIG_SMP宏,則這個函數為空函數。

//如果定義了CONFIG_SMP宏,則這個setup_per_cpu_areas()函數給每個CPU分配內存,

//並拷貝.data.percpu段的數據。為系統中的每個CPU的per_cpu變量申請空間。

setup_per_cpu_areas();

//定義在include/asm-x86/smp.h。

//如果是SMP環境,則設置boot CPU的一些數據。在引導過程中使用的CPU稱為boot CPU

smp_prepare_boot_cpu(); /* arch-specific boot-cpu hooks */

/* 進程調度器初始化 */

sched_init();

/* 禁止內核搶占 */

preempt_disable();

//設置node 和 zone 數據結構

//內存管理的講解:http://blog.chinaunix.net/space.php?uid=361890&do=blog&cuid=2146541

build_all_zonelists(NULL);

//初始化page allocation相關結構

page_alloc_init();

/* 打印Linux啟動命令行參數 */

printk(KERN_NOTICE "Kernel command line: %s/n", boot_command_line);

//解析內核參數

//對內核參數的解析:http://hi.baidu.com/yuhuntero/blog/item/654a7411e45ce519b8127ba9.html

parse_early_param();

parse_args("Booting kernel", static_command_line, __start___param,

__stop___param - __start___param,

&unknown_bootoption);

/*

* These use large bootmem allocations and must precede

* kmem_cache_init()

*/

//初始化hash表,以便於從進程的PID獲得對應的進程描述指針,按照實際的物理內存初始化pid hash表

//這裏涉及到進程管理http://blog.csdn.net/satanwxd/archive/2010/03/27/5422053.aspx

pidhash_init();

//初始化VFS的兩個重要數據結構dcache和inode的緩存。

//http://blog.csdn.net/yunsongice/archive/2011/02/01/6171324.aspx

vfs_caches_init_early();

//把編譯期間,kbuild設置的異常表,也就是__start___ex_table和__stop___ex_table之中的所有元素進行排序

sort_main_extable();

//初始化中斷向量表

//http://blog.csdn.net/yunsongice/archive/2011/02/01/6171325.aspx

trap_init();

//memory map初始化

//http://blog.csdn.net/huyugv_830913/archive/2010/09/15/5886970.aspx

mm_init();

/*

* Set up the scheduler prior starting any interrupts (such as the

* timer interrupt). Full topology setup happens at smp_init()

* time - but meanwhile we still have a functioning scheduler.

*/

//核心進程調度器初始化,調度器的初始化的優先級要高於任何中斷的建立,

//並且初始化進程0,即idle進程,但是並沒有設置idle進程的NEED_RESCHED標誌,

//所以還會繼續完成內核初始化剩下的事情。

//這裏僅僅為進程調度程序的執行做準備。

//它所做的具體工作是調用init_bh函數(kernel/softirq.c)把timer,tqueue,immediate三個人物隊列加入下半部分的數組

sched_init();

/*

* Disable preemption - early bootup scheduling is extremely

* fragile until we cpu_idle() for the first time.

*/

//搶占計數器加1

preempt_disable();

//檢查中斷是否打開,如果已經打開,則關閉中斷

if (!irqs_disabled()) {

printk(KERN_WARNING "start_kernel(): bug: interrupts were "

"enabled *very* early, fixing it/n");

local_irq_disable();

}

sort_main_extable();

/*

* trap_init函數完成對系統保留中斷向量(異常、非屏蔽中斷以及系統調用)

* 的初始化,init_IRQ函數則完成其余中斷向量的初始化

*/

trap_init();

//Read-Copy-Update的初始化

//RCU機制是Linux2.6之後提供的一種數據一致性訪問的機制,

//從RCU(read-copy-update)的名稱上看,我們就能對他的實現機制有一個大概的了解,

//在修改數據的時候,首先需要讀取數據,然後生成一個副本,對副本進行修改,

//修改完成之後再將老數據update成新的數據,此所謂RCU。

//http://blog.ednchina.com/tiloog/193361/message.aspx

//http://blogold.chinaunix.net/u1/51562/showart_1341707.html

rcu_init();

//初始化IRQ中斷和終端描述符。

//初始化系統中支持的最大可能的中斷描述結構struct irqdesc變量數組irq_desc[NR_IRQS],

//把每個結構變量irq_desc[n]都初始化為預先定義好的壞中斷描述結構變量bad_irq_desc,

//並初始化該中斷的鏈表表頭成員結構變量pend

init_IRQ();

/* 初始化hash表,便於從進程的PID獲得對應的進程描述符指針 */

pidhash_init();

//初始化定時器Timer相關的數據結構

//http://www.ibm.com/developerworks/cn/linux/l-cn-clocks/index.html

init_timers();

//對高精度時鐘進行初始化

hrtimers_init();

//軟中斷初始化

//http://blogold.chinaunix.net/u1/51562/showart_494363.html

softirq_init();

//初始化時鐘源

timekeeping_init();

//初始化系統時間,

//檢查系統定時器描述結構struct sys_timer全局變量system_timer是否為空,

//如果為空將其指向dummy_gettimeoffset()函數。

//http://www.ibm.com/developerworks/cn/linux/l-cn-clocks/index.html

time_init();

//profile只是內核的一個調試性能的工具,

//這個可以通過menuconfig中的Instrumentation Support->profile打開。

//http://www.linuxdiyf.com/bbs//thread-71446-1-1.html

profile_init();

/*if判斷中斷是否打開,如果已經打開,打印數據*/

if (!irqs_disabled())

printk(KERN_CRIT "start_kernel(): bug: interrupts were enabled early/n");

//與開始的early_boot_irqs_off相對應

early_boot_irqs_on();

//與local_irq_disbale相對應,開CPU中斷

local_irq_enable();

/*

* HACK ALERT! This is early. We‘re enabling the console before

* we‘ve done PCI setups etc, and console_init() must be aware of

* this. But we do want output early, in case something goes wrong.

*/

//初始化控制臺以顯示printk的內容,在此之前調用的printk,只是把數據存到緩沖區裏,

//只有在這個函數調用後,才會在控制臺打印出內容

//該函數執行後可調用printk()函數將log_buf中符合打印級別要求的系統信息打印到控制臺上。

console_init();

if (panic_later)

panic(panic_later, panic_param);

//如果定義了CONFIG_LOCKDEP宏,那麽就打印鎖依賴信息,否則什麽也不做

lockdep_info();

/*

* Need to run this when irqs are enabled, because it wants

* to self-test [hard/soft]-irqs on/off lock inversion bugs

* too:

*/

//如果定義CONFIG_DEBUG_LOCKING_API_SELFTESTS宏

//則locking_selftest()是一個空函數,否則執行鎖自測

locking_selftest();

#ifdef CONFIG_BLK_DEV_INITRD

if (initrd_start && !initrd_below_start_ok &&

page_to_pfn(virt_to_page((void *)initrd_start)) < min_low_pfn) {

printk(KERN_CRIT "initrd overwritten (0x%08lx < 0x%08lx) - "

"disabling it./n",

page_to_pfn(virt_to_page((void *)initrd_start)),

min_low_pfn);

initrd_start = 0;

}

#endif

/* 虛擬文件系統的初始化 */

vfs_caches_init_early();

cpuset_init_early();

mem_init();

/* slab初始化 */

kmem_cache_init();

//是否是對SMP的支持,單核是否需要??這個要分析

setup_per_cpu_pageset();

numa_policy_init();

if (late_time_init)

late_time_init();

//calibrate_delay()函數可以計算出cpu在一秒鐘內執行了多少次一個極短的循環,

//計算出來的值經過處理後得到BogoMIPS 值,

//Bogo是Bogus(偽)的意思,MIPS是millions of instructions per second(百萬條指令每秒)的縮寫。

//這樣我們就知道了其實這個函數是linux內核中一個cpu性能測試函數。

//http://blogold.chinaunix.net/u2/86768/showart_2196664.html

calibrate_delay();

//PID是process id的縮寫

//http://blog.csdn.net/satanwxd/archive/2010/03/27/5422053.aspx

pidmap_init();

/* 接下來的函數中,大多數都是為有關的管理機制建立專用的slab緩存 */

pgtable_cache_init();

/* 初始化優先級樹index_bits_to_maxindex數組 */

prio_tree_init();

//來自mm/rmap.c

//分配一個anon_vma_cachep作為anon_vma的slab緩存。

//這個技術是PFRA(頁框回收算法)技術中的組成部分。

//這個技術為定位而生——快速的定位指向同一頁框的所有頁表項。

anon_vma_init();

#ifdef CONFIG_X86

if (efi_enabled)

efi_enter_virtual_mode();

#endif

//根據物理內存大小計算允許創建進程的數量

//http://www.jollen.org/blog/2006/11/jollen_linux_3_fork_init.html

fork_init(totalram_pages);

//給進程的各種資源管理結構分配了相應的對象緩存區

//http://www.shangshuwu.cn/index.php/Linux內核的進程創建

proc_caches_init();

//創建 buffer_head SLAB 緩存

buffer_init();

unnamed_dev_init();

//初始化key的management stuff

key_init();

//關於系統安全的初始化,主要是訪問控制

//http://blog.csdn.net/nhczp/archive/2008/04/29/2341194.aspx

security_init();

//調用kmem_cache_create()函數來為VFS創建各種SLAB分配器緩存

//包括:names_cachep、filp_cachep、dquot_cachep和bh_cachep等四個SLAB分配器緩存

vfs_caches_init(totalram_pages);

radix_tree_init();

//創建信號隊列

signals_init();

/* rootfs populating might need page-writeback */

//回寫相關的初始化

//http://blog.csdn.net/yangp01/archive/2010/04/06/5454822.aspx

page_writeback_init();

#ifdef CONFIG_PROC_FS

proc_root_init();

#endif

//http://blogold.chinaunix.net/u1/51562/showart_1777937.html

cpuset_init();

////進程狀態初始化,實際上就是分配了一個存儲線程狀態的高速緩存

taskstats_init_early();

delayacct_init();

//測試CPU的各種缺陷,記錄檢測到的缺陷,以便於內核的其他部分以後可以使用他們工作。

check_bugs();

//電源相關的初始化

//http://blogold.chinaunix.net/u/548/showart.php?id=377952

acpi_early_init(); /* before LAPIC and SMP init */

//接著進入rest_init()繼續初始化

rest_init();

}

第3階段——內核啟動分析之start_kernel初始化函數(5)