棧是什么?棧有什么作用?
首先,棧 (stack) 是一種串列形式的 數(shù)據(jù)結(jié)構(gòu)。這種數(shù)據(jù)結(jié)構(gòu)的特點是 后入先出 (LIFO, Last In First Out),數(shù)據(jù)只能在串列的一端 (稱為:棧頂 top) 進行 推入 (push) 和 彈出 (pop) 操作。根據(jù)棧的特點,很容易的想到可以利用數(shù)組,來實現(xiàn)這種數(shù)據(jù)結(jié)構(gòu)。但是本文要討論的并不是軟件層面的棧,而是硬件層面的棧。大多數(shù)的處理器架構(gòu),都有實現(xiàn)硬件棧。有專門的棧指針寄存器,以及特定的硬件指令來完成 入棧/出棧 的操作。例如在 ARM 架構(gòu)上,R13 (SP) 指針是堆棧指針寄存器,而 PUSH 是用于壓棧的匯編指令,POP 則是出棧的匯編指令。【擴展閱讀】ARM 寄存器簡介ARM 處理器擁有 37 個寄存器。這些寄存器按部分重疊組方式加以排列。每個處理器模式都有一個不同的寄存器組。編組的寄存器為處理處理器異常和特權(quán)操作提供了快速的上下文切換。提供了下列寄存器:上面是棧的原理和實現(xiàn),下面我們來看看棧有什么作用。棧作用可以從兩個方面體現(xiàn):函數(shù)調(diào)用 和 多任務支持 。
- 三十個 32 位通用寄存器:
- 存在十五個通用寄存器,它們分別是 r0-r12、sp、lr
- sp (r13) 是堆棧指針。C/C 編譯器始終將 sp 用作堆棧指針
- lr (r14) 用于存儲調(diào)用子例程時的返回地址。如果返回地址存儲在堆棧上,則可將 lr 用作通用寄存器
- 程序計數(shù)器 (pc):指令寄存器
- 應用程序狀態(tài)寄存器 (APSR):存放算術邏輯單元 (ALU) 狀態(tài)標記的副本
- 當前程序狀態(tài)寄存器 (CPSR):存放 APSR 標記,當前處理器模式,中斷禁用標記等
- 保存的程序狀態(tài)寄存器 (SPSR):當發(fā)生異常時,使用 SPSR 來存儲 CPSR
一、函數(shù)調(diào)用
我們知道一個函數(shù)調(diào)用有以下三個基本過程:- 調(diào)用參數(shù)的傳入
- 局部變量的空間管理
- 函數(shù)返回
【擴展閱讀】:函數(shù)棧幀 (Stack Frame)函數(shù)調(diào)用經(jīng)常是嵌套的,在同一時刻,棧中會有多個函數(shù)的信息。每個未完成運行的函數(shù)占用一個獨立的連續(xù)區(qū)域,稱作棧幀(Stack Frame)。棧幀存放著函數(shù)參數(shù),局部變量及恢復前一棧幀所需要的數(shù)據(jù)等,函數(shù)調(diào)用時入棧的順序為:實參N~1 → 主調(diào)函數(shù)返回地址 → 主調(diào)函數(shù)幀基指針EBP → 被調(diào)函數(shù)局部變量1~N棧幀的邊界由 棧幀基地址指針 EBP 和 棧指針 ESP 界定,EBP 指向當前棧幀底部(高地址),在當前棧幀內(nèi)位置固定;ESP指向當前棧幀頂部(低地址),當程序執(zhí)行時ESP會隨著數(shù)據(jù)的入棧和出棧而移動。因此函數(shù)中對大部分數(shù)據(jù)的訪問都基于EBP進行。函數(shù)調(diào)用棧的典型內(nèi)存布局如下圖所示:
二、多任務支持
然而棧的意義還不只是函數(shù)調(diào)用,有了它的存在,才能構(gòu)建出操作系統(tǒng)的多任務模式。我們以 main 函數(shù)調(diào)用為例,main 函數(shù)包含一個無限循環(huán)體,循環(huán)體中先調(diào)用 A 函數(shù),再調(diào)用 B 函數(shù)。func?B():
??return;
func?A():
??B();
func?main():
??while?(1)
????A();
試想在單處理器情況下,程序?qū)⒂肋h停留在此 main 函數(shù)中。即使有另外一個任務在等待狀態(tài),程序是沒法從此 main 函數(shù)里面跳轉(zhuǎn)到另一個任務。因為如果是函數(shù)調(diào)用關系,本質(zhì)上還是屬于 main 函數(shù)的任務中,不能算多任務切換。此刻的 main 函數(shù)任務本身其實和它的棧綁定在了一起,無論如何嵌套調(diào)用函數(shù),棧指針都在本棧范圍內(nèi)移動。由此可以看出一個任務可以利用以下信息來表征:- main 函數(shù)體代碼
- main 函數(shù)棧指針
- 當前 CPU 寄存器信息
【擴展閱讀】:任務、線程、進程 三者關系任務是一個抽象的概念,即指軟件完成的一個活動;而線程則是完成任務所需的動作;進程則指的是完成此動作所需資源的統(tǒng)稱;關于三者的關系,有一個形象的比喻:
- 任務 = 送貨
- 線程 = 開送貨車
- 系統(tǒng)調(diào)度 = 決定合適開哪部送貨車
- 進程 = 道路 加油站 送貨車 修車廠
Linux 中有幾種棧?各種棧的內(nèi)存位置?
介紹完棧的工作原理和用途作用后,我們回歸到 Linux 內(nèi)核上來。內(nèi)核將棧分成四種:- 進程棧
- 線程棧
- 內(nèi)核棧
- 中斷棧
一、進程棧
進程棧是屬于用戶態(tài)棧,和進程 虛擬地址空間 (Virtual Address Space) 密切相關。那我們先了解下什么是虛擬地址空間:在 32 位機器下,虛擬地址空間大小為 4G。這些虛擬地址通過頁表 (Page Table) 映射到物理內(nèi)存,頁表由操作系統(tǒng)維護,并被處理器的內(nèi)存管理單元 (MMU) 硬件引用。每個進程都擁有一套屬于它自己的頁表,因此對于每個進程而言都好像獨享了整個虛擬地址空間。Linux 內(nèi)核將這 4G 字節(jié)的空間分為兩部分,將最高的 1G 字節(jié)(0xC0000000-0xFFFFFFFF)供內(nèi)核使用,稱為 內(nèi)核空間。而將較低的3G字節(jié)(0x00000000-0xBFFFFFFF)供各個進程使用,稱為 用戶空間。每個進程可以通過系統(tǒng)調(diào)用陷入內(nèi)核態(tài),因此內(nèi)核空間是由所有進程共享的。雖然說內(nèi)核和用戶態(tài)進程占用了這么大地址空間,但是并不意味它們使用了這么多物理內(nèi)存,僅表示它可以支配這么大的地址空間。它們是根據(jù)需要,將物理內(nèi)存映射到虛擬地址空間中使用。Linux 對進程地址空間有個標準布局,地址空間中由各個不同的內(nèi)存段組成 (Memory Segment),主要的內(nèi)存段如下:- 程序段 (Text Segment):可執(zhí)行文件代碼的內(nèi)存映射
- 數(shù)據(jù)段 (Data Segment):可執(zhí)行文件的已初始化全局變量的內(nèi)存映射
- BSS段 (BSS Segment):未初始化的全局變量或者靜態(tài)變量(用零頁初始化)
- 堆區(qū) (Heap) : 存儲動態(tài)內(nèi)存分配,匿名的內(nèi)存映射
- 棧區(qū) (Stack) : 進程用戶空間棧,由編譯器自動分配釋放,存放函數(shù)的參數(shù)值、局部變量的值等
- 映射段(Memory Mapping Segment):任何內(nèi)存映射文件
而上面進程虛擬地址空間中的棧區(qū),正指的是我們所說的進程棧。進程棧的初始化大小是由編譯器和鏈接器計算出來的,但是棧的實時大小并不是固定的,Linux 內(nèi)核會根據(jù)入棧情況對棧區(qū)進行動態(tài)增長(其實也就是添加新的頁表)。但是并不是說棧區(qū)可以無限增長,它也有最大限制 RLIMIT_STACK (一般為 8M),我們可以通過 ulimit 來查看或更改 RLIMIT_STACK 的值。
【擴展閱讀】:如何確認進程棧的大小我們要知道棧的大小,那必須得知道棧的起始地址和結(jié)束地址。棧起始地址 獲取很簡單,只需要嵌入?yún)R編指令獲取棧指針 esp 地址即可。棧結(jié)束地址 的獲取有點麻煩,我們需要先利用遞歸函數(shù)把棧搞溢出了,然后再 GDB 中把棧溢出的時候把棧指針 esp 打印出來即可。代碼如下:
/*?file?name:?stacksize.c?*/
void?*orig_stack_pointer;
void?blow_stack()?{
????blow_stack();
}
int?main()?{
????__asm__("movl?%esp,?orig_stack_pointer");
????blow_stack();
????return?0;
}
$ g -g stacksize.c -o ./stacksize
$ gdb ./stacksize
(gdb) r
Starting program: /home/home/misc-code/setrlimit
Program received signal SIGSEGV, Segmentation fault.
blow_stack () at setrlimit.c:4
4 blow_stack();
(gdb) print (void *)$esp
$1 = (void *) 0xffffffffff7ff000
(gdb) print (void *)orig_stack_pointer
$2 = (void *) 0xffffc800
(gdb) print 0xffffc800-0xff7ff000
$3 = 8378368 // Current Process Stack Size is 8M
上面對進程的地址空間有個比較全局的介紹,那我們看下 Linux 內(nèi)核中是怎么體現(xiàn)上面內(nèi)存布局的。內(nèi)核使用內(nèi)存描述符來表示進程的地址空間,該描述符表示著進程所有地址空間的信息。內(nèi)存描述符由 mm_struct 結(jié)構(gòu)體表示,下面給出內(nèi)存描述符結(jié)構(gòu)中各個域的描述,請大家結(jié)合前面的 進程內(nèi)存段布局 圖一起看:struct?mm_struct?{
????struct?vm_area_struct?*mmap;???????????/*?內(nèi)存區(qū)域鏈表?*/
????struct?rb_root?mm_rb;??????????????????/*?VMA?形成的紅黑樹?*/
????...
????struct?list_head?mmlist;???????????????/*?所有?mm_struct?形成的鏈表?*/
????...
????unsigned?long?total_vm;????????????????/*?全部頁面數(shù)目?*/
????unsigned?long?locked_vm;???????????????/*?上鎖的頁面數(shù)據(jù)?*/
????unsigned?long?pinned_vm;???????????????/*?Refcount?permanently?increased?*/
????unsigned?long?shared_vm;???????????????/*?共享頁面數(shù)目?Shared?pages?(files)?*/
????unsigned?long?exec_vm;?????????????????/*?可執(zhí)行頁面數(shù)目?VM_EXEC?