完全剖析?-?Linux虛擬內(nèi)存空間管理

時(shí)間：2021-07-02 06:53:53

關(guān)鍵字： Linux 虛擬內(nèi)存

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]今天，我們來介紹一下 Linux 對虛擬內(nèi)存空間管理的細(xì)節(jié)。

在《漫畫解說內(nèi)存映射》一文中介紹過 虛擬內(nèi)存

 與 物理內(nèi)存 映射的原理與過程，虛擬內(nèi)存與物理內(nèi)存進(jìn)行映射的過程被稱為 內(nèi)存映射。內(nèi)存映射是硬件（內(nèi)存管理單元）級(jí)別的功能，必須按照硬件的規(guī)范設(shè)置好內(nèi)存映射的關(guān)系，進(jìn)程才能正常運(yùn)行。

但內(nèi)存映射并不能區(qū)分內(nèi)存的用途，比如我們想知道虛擬內(nèi)存區(qū)間 0 ~ 2MB 是用作存儲(chǔ)數(shù)據(jù)還是存儲(chǔ)指令，這就很難從內(nèi)存映射中獲取到相關(guān)信息。所以，Linux 根據(jù)功能上的差異，來對虛擬內(nèi)存空間進(jìn)行管理。

今天，我們來介紹一下 Linux 對虛擬內(nèi)存空間管理的細(xì)節(jié)。

段 
	
之前我們說過，在 32 位的操作系統(tǒng)中，每個(gè)進(jìn)程都擁有 4GB 的虛擬內(nèi)存空間。Linux 根據(jù)功能上的差異，把整個(gè)虛擬內(nèi)存空間劃分為多個(gè)不同區(qū)間，稱為 段。

我們先來看看 Linux 進(jìn)程虛擬內(nèi)存空間的布局圖，如圖 1 所示：

 

上圖展示了 Linux 進(jìn)程的虛擬內(nèi)存空間布局情況，我們只關(guān)注 用戶空間 的布局。

從上圖可以看出，進(jìn)程的用戶空間大小為 3GB。Linux 按照功能上的差異，把一個(gè)進(jìn)程的用戶空間劃分為多個(gè)段，下面介紹一下各個(gè)段的作用：


	
		代碼段：用于存放程序中可執(zhí)行代碼的段。

 
	

	
		數(shù)據(jù)段：用于存放已經(jīng)初始化的全局變量或靜態(tài)變量的段。如在 C 語言中，使用語句 int global = 10; 定義的全局變量。

 
	

	
		未初始化數(shù)據(jù)段：用于存放未初始化的全局變量或靜態(tài)變量的段。如在 C 語言中，使用語句 int global; 定義的全局變量。

 
	

	
		堆：用于存放使用 malloc 函數(shù)申請的內(nèi)存。

 
	

	
		mmap區(qū)：用于存放使用 mmap 函數(shù)映射的內(nèi)存區(qū)。

 
	

	
		棧：用于存放函數(shù)局部變量和函數(shù)參數(shù)。

 
	

		

虛擬內(nèi)存區(qū) 
			

從上面的介紹可知，Linux 按照功能上的差異，把虛擬內(nèi)存空間劃分為多個(gè) 段。那么在內(nèi)核中，是通過什么結(jié)構(gòu)來管理這些段的呢？

答案就是：vm_area_struct。 
			
				

			
				
內(nèi)核通過 vm_area_struct 結(jié)構(gòu)（虛擬內(nèi)存區(qū)）來管理各個(gè) 段，其定義如下：

  1struct vm_area_struct {

 2 struct mm_struct *vm_mm; /* The address space we belong to. */

 3 unsigned long vm_start; /* Our start address within vm_mm. */

 4 unsigned long vm_end; /* The first byte after our end address within vm_mm. */

 5

 6 /* linked list of VM areas per task, sorted by address */

 7 struct vm_area_struct *vm_next;

 8

 9 pgprot_t vm_page_prot; /* Access permissions of this VMA. */

10 unsigned long vm_flags; /* Flags, see mm.h. */

11 struct rb_node vm_rb;

12 ...

13 /* Function pointers to deal with this struct. */

14 const struct vm_operations_struct *vm_ops;

15 ...

16};

下面介紹一下各個(gè)字段的作用：


				
					vm_mm：指向進(jìn)程的內(nèi)存管理對象，每個(gè)進(jìn)程都有一個(gè)類型為 mm_struct 的內(nèi)存管理對象，用于管理進(jìn)程的虛擬內(nèi)存空間和內(nèi)存映射等。

 
				

				
					vm_start：虛擬內(nèi)存區(qū)的起始虛擬內(nèi)存地址。

 
				

				
					vm_end：虛擬內(nèi)存區(qū)的結(jié)束虛擬內(nèi)存地址。

 
				

				
					vm_next：Linux 會(huì)通過鏈表把進(jìn)程的所有虛擬內(nèi)存區(qū)連接起來，這個(gè)字段用于指向下一個(gè)虛擬內(nèi)存區(qū)。

 
				

				
					vm_page_prot：主要用于保存當(dāng)前虛擬內(nèi)存區(qū)所映射的物理內(nèi)存頁的讀寫權(quán)限。

 
				

				
					vm_flags：標(biāo)識(shí)當(dāng)前虛擬內(nèi)存區(qū)的功能特性。

 
				

				
					vm_rb：某些場景中需要通過虛擬內(nèi)存地址查找對應(yīng)的虛擬內(nèi)存區(qū)，為了加速查找過程，內(nèi)核以虛擬內(nèi)存地址作為key，把進(jìn)程所有的虛擬內(nèi)存區(qū)保存到一棵紅黑樹中，而這個(gè)字段就是紅黑樹的節(jié)點(diǎn)結(jié)構(gòu)。

 
				

				
					vm_ops：每個(gè)虛擬內(nèi)存區(qū)都可以自定義一套操作接口，通過操作接口，能夠讓虛擬內(nèi)存區(qū)實(shí)現(xiàn)一些特定的功能，比如：把虛擬內(nèi)存區(qū)映射到文件。而 vm_ops 字段就是虛擬內(nèi)存區(qū)的操作接口集，一般在創(chuàng)建虛擬內(nèi)存區(qū)時(shí)指定。

 
				

					

我們通過圖 2 來展示內(nèi)核是怎么通過 vm_area_struct 結(jié)構(gòu)來管理進(jìn)程中的所有 段：

 

從上圖可以看出，內(nèi)核通過一個(gè)鏈表和一棵紅黑樹來管理進(jìn)程中所有的 段。mm_struct 結(jié)構(gòu)的 mmap 字段就是鏈表的頭節(jié)點(diǎn)，而 mm_rb 字段就是紅黑樹的根節(jié)點(diǎn)。

加載程序鏡像 
						
前面我們介紹了 Linux  會(huì)把虛擬內(nèi)存地址劃分為多個(gè) 段，并且使用 vm_area_struct 結(jié)構(gòu)來管理這些段。那么，這些虛擬內(nèi)存區(qū)是怎么建立起來的呢？

在介紹進(jìn)程虛擬內(nèi)存區(qū)建立的過程前，我們先來簡單介紹一下 ELF文件格式。

 
						
							1. ELF文件 
						
ELF 全稱 Executable and Linkable Format，即可執(zhí)行可鏈接文件格式。在 Linux 系統(tǒng)中，就是使用這種文件格式來存儲(chǔ)一個(gè)可執(zhí)行的應(yīng)用程序。讓我們來看一下 ELF 文件格式由哪些結(jié)構(gòu)組成：

一般一個(gè) ELF 文件由以下三部分組成：


						
							ELF 頭（ELF header）：描述應(yīng)用程序的類型、CPU架構(gòu)、入口地址、程序頭表偏移和節(jié)頭表偏移等等；

 
						
						
							程序頭表（Program header table）：列舉了所有有效的段（segments）和他們的屬性，程序頭表需要加載器將文件中的段加載到虛擬內(nèi)存段中；

 
						
						
							節(jié)頭表（Section header table）：包含對節(jié)（sections）的描述。

 
						
							
ELF 文件的結(jié)構(gòu)大概如圖3所示：

 

當(dāng)內(nèi)核加載一個(gè)應(yīng)用程序時(shí)，就是通過讀取 ELF 文件的信息，然后把文件中所有的段加載到虛擬內(nèi)存的段中。ELF 文件通過 程序頭表 來描述應(yīng)用程序中所有的段，表中的每一個(gè)項(xiàng)都描述一個(gè)段的信息。我們先來看看 程序頭表 項(xiàng)的結(jié)構(gòu)定義：

 1typedef struct elf64_phdr {

 2 Elf64_Word p_type; // 段的類型

 3 Elf64_Word p_flags; // 可讀寫標(biāo)志

 4 Elf64_Off p_offset; // 段在ELF文件中的偏移量

 5 Elf64_Addr p_vaddr; // 段的虛擬內(nèi)存地址

 6 Elf64_Addr p_paddr; // 段的物理內(nèi)存地址

 7 Elf64_Xword p_filesz; // 段占用文件的大小

 8 Elf64_Xword p_memsz; // 段占用內(nèi)存的大小

 9 Elf64_Xword p_align; // 內(nèi)存對齊

10} Elf64_Phdr;

所以，程序加載器可以通過 ELF 頭中獲取到程序頭表的偏移量，然后通過程序頭表的偏移量讀取到程序頭表的數(shù)據(jù)，再通過程序頭表來獲取到所有段的信息。

我們可以通過 readelf -S file 命令來查看 ELF 文件的段（節(jié)）信息，如下圖所示：

 

上面列出了 代碼段、數(shù)據(jù)段、未初始化數(shù)據(jù)段 和 注釋段 的信息。

 
							
								2. 加載過程 
							
要加載一個(gè)程序，需要調(diào)用 execve 系統(tǒng)調(diào)用來完成。我們來看看 execve 系統(tǒng)調(diào)用的調(diào)用棧：

1sys_execve

2└→ do_execve

3 └→ do_execveat_common

4 └→ __do_execve_file

5 └→ exec_binprm

6 └→ search_binary_handler

7 └→ load_elf_binary

從上面的調(diào)用者可以看出，execve 系統(tǒng)調(diào)用最終會(huì)調(diào)用 load_elf_binary 函數(shù)來加載程序的 ELF 文件。

由于 load_elf_binary 函數(shù)的實(shí)現(xiàn)比較復(fù)雜，所以我們分段來解說：

（1）讀取并檢查ELF頭

 1static int load_elf_binary(struct linux_binprm *bprm, struct pt_regs *regs)

 2{

 3 ...

 4 struct {

 5 struct elfhdr elf_ex;

 6 struct elfhdr interp_elf_ex;

 7 } *loc;

 8

 9 loc = kmalloc(sizeof(*loc), GFP_KERNEL);

10 if (!loc) {

11 retval = -ENOMEM;

12 goto out_ret;

13 }

14

15 // 1. 獲取ELF頭

16 loc->elf_ex = *((struct elfhdr *)bprm->buf);

17

18 retval = -ENOEXEC;

19 // 2. 檢查ELF簽名是否正確

20 if (memcmp(loc->elf_ex.e_ident, ELFMAG, SELFMAG) != 0)

21 goto out;

22

23 // 3. 是否是可執(zhí)行文件或者動(dòng)態(tài)庫

24 if (loc->elf_ex.e_type != ET_EXEC


                
            欲知詳情，請下載word文檔 下載文檔

完全剖析?-?Linux虛擬內(nèi)存空間管理

段

`虛擬內(nèi)存區(qū)`

加載程序鏡像

1. ELF文件

2. 加載過程

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車市場，使汽車開發(fā)時(shí)間和成本降低90%

從容應(yīng)對未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

中國通信服務(wù)公布2024年中期業(yè)績

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

軟通動(dòng)力與長三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

海南區(qū)6家凱悅系酒店與嵐圖達(dá)成戰(zhàn)略合作，共同推動(dòng)新能源出行體驗(yàn)

安嵐攜手妮可?巴菲特開啟療愈之旅在秋日紅葉的浪漫中療愈身心

不懼美國封鎖！華為：我們給大家提供系統(tǒng)、存儲(chǔ)等

尼爾森IQ深耕中國四十載，共繪未來新篇章

第二十二屆跨盈年度B2B營銷高管峰會(huì)2025聚焦"營銷競?cè)。蚱剖袌鰞?nèi)卷實(shí)現(xiàn)認(rèn)知進(jìn)化"

恒久動(dòng)力馳騁天地美孚1號(hào)攜手周冠宇邀您縱擎馳騁，勁享駕趣體驗(yàn)

美通社母公司Cision發(fā)布CisionOne平臺(tái)，進(jìn)軍亞太地區(qū)媒體監(jiān)測市場

移遠(yuǎn)通信推出大模型解決方案，重塑千行百業(yè)智能邊界

高途公布2024年第二季度未經(jīng)審計(jì)業(yè)績

華為發(fā)布AI百校計(jì)劃：培養(yǎng)AI人才每年獲最高100萬支持