當(dāng)前位置:首頁 > 公眾號(hào)精選 > 程序喵大人
[導(dǎo)讀]今天,我們來介紹一下 Linux 對虛擬內(nèi)存空間管理的細(xì)節(jié)。

在 《漫畫解說內(nèi)存映射》一文中介紹過 虛擬內(nèi)存物理內(nèi)存 映射的原理與過程,虛擬內(nèi)存與物理內(nèi)存進(jìn)行映射的過程被稱為 內(nèi)存映射。內(nèi)存映射是硬件(內(nèi)存管理單元)級(jí)別的功能,必須按照硬件的規(guī)范設(shè)置好內(nèi)存映射的關(guān)系,進(jìn)程才能正常運(yùn)行。
但內(nèi)存映射并不能區(qū)分內(nèi)存的用途,比如我們想知道虛擬內(nèi)存區(qū)間 0 ~ 2MB 是用作存儲(chǔ)數(shù)據(jù)還是存儲(chǔ)指令,這就很難從內(nèi)存映射中獲取到相關(guān)信息。所以,Linux 根據(jù)功能上的差異,來對虛擬內(nèi)存空間進(jìn)行管理。
今天,我們來介紹一下 Linux 對虛擬內(nèi)存空間管理的細(xì)節(jié)。

之前我們說過,在 32 位的操作系統(tǒng)中,每個(gè)進(jìn)程都擁有 4GB 的虛擬內(nèi)存空間。Linux 根據(jù)功能上的差異,把整個(gè)虛擬內(nèi)存空間劃分為多個(gè)不同區(qū)間,稱為 。
我們先來看看 Linux 進(jìn)程虛擬內(nèi)存空間的布局圖,如圖 1 所示:

上圖展示了 Linux 進(jìn)程的虛擬內(nèi)存空間布局情況,我們只關(guān)注 用戶空間 的布局。
從上圖可以看出,進(jìn)程的用戶空間大小為 3GB。Linux 按照功能上的差異,把一個(gè)進(jìn)程的用戶空間劃分為多個(gè)段,下面介紹一下各個(gè)段的作用:
  • 代碼段:用于存放程序中可執(zhí)行代碼的段。
  • 數(shù)據(jù)段:用于存放已經(jīng)初始化的全局變量或靜態(tài)變量的段。如在 C 語言中,使用語句 int global = 10; 定義的全局變量。
  • 未初始化數(shù)據(jù)段:用于存放未初始化的全局變量或靜態(tài)變量的段。如在 C 語言中,使用語句 int global; 定義的全局變量。
  • :用于存放使用 malloc 函數(shù)申請的內(nèi)存。
  • mmap區(qū):用于存放使用 mmap 函數(shù)映射的內(nèi)存區(qū)。
  • :用于存放函數(shù)局部變量和函數(shù)參數(shù)。

虛擬內(nèi)存區(qū)

從上面的介紹可知,Linux 按照功能上的差異,把虛擬內(nèi)存空間劃分為多個(gè) 。那么在內(nèi)核中,是通過什么結(jié)構(gòu)來管理這些段的呢?
答案就是:vm_area_struct。


內(nèi)核通過 vm_area_struct 結(jié)構(gòu)(虛擬內(nèi)存區(qū))來管理各個(gè) ,其定義如下:
1struct vm_area_struct {
2 struct mm_struct *vm_mm; /* The address space we belong to. */
3 unsigned long vm_start; /* Our start address within vm_mm. */
4 unsigned long vm_end; /* The first byte after our end address within vm_mm. */
5
6 /* linked list of VM areas per task, sorted by address */
7 struct vm_area_struct *vm_next;
8
9 pgprot_t vm_page_prot; /* Access permissions of this VMA. */
10 unsigned long vm_flags; /* Flags, see mm.h. */
11 struct rb_node vm_rb;
12 ...
13 /* Function pointers to deal with this struct. */
14 const struct vm_operations_struct *vm_ops;
15 ...
16};
下面介紹一下各個(gè)字段的作用:
  • vm_mm:指向進(jìn)程的內(nèi)存管理對象,每個(gè)進(jìn)程都有一個(gè)類型為 mm_struct 的內(nèi)存管理對象,用于管理進(jìn)程的虛擬內(nèi)存空間和內(nèi)存映射等。
  • vm_start:虛擬內(nèi)存區(qū)的起始虛擬內(nèi)存地址。
  • vm_end:虛擬內(nèi)存區(qū)的結(jié)束虛擬內(nèi)存地址。
  • vm_next:Linux 會(huì)通過鏈表把進(jìn)程的所有虛擬內(nèi)存區(qū)連接起來,這個(gè)字段用于指向下一個(gè)虛擬內(nèi)存區(qū)。
  • vm_page_prot:主要用于保存當(dāng)前虛擬內(nèi)存區(qū)所映射的物理內(nèi)存頁的讀寫權(quán)限。
  • vm_flags:標(biāo)識(shí)當(dāng)前虛擬內(nèi)存區(qū)的功能特性。
  • vm_rb:某些場景中需要通過虛擬內(nèi)存地址查找對應(yīng)的虛擬內(nèi)存區(qū),為了加速查找過程,內(nèi)核以虛擬內(nèi)存地址作為key,把進(jìn)程所有的虛擬內(nèi)存區(qū)保存到一棵紅黑樹中,而這個(gè)字段就是紅黑樹的節(jié)點(diǎn)結(jié)構(gòu)。
  • vm_ops:每個(gè)虛擬內(nèi)存區(qū)都可以自定義一套操作接口,通過操作接口,能夠讓虛擬內(nèi)存區(qū)實(shí)現(xiàn)一些特定的功能,比如:把虛擬內(nèi)存區(qū)映射到文件。而 vm_ops 字段就是虛擬內(nèi)存區(qū)的操作接口集,一般在創(chuàng)建虛擬內(nèi)存區(qū)時(shí)指定。
我們通過圖 2 來展示內(nèi)核是怎么通過 vm_area_struct 結(jié)構(gòu)來管理進(jìn)程中的所有

從上圖可以看出,內(nèi)核通過一個(gè)鏈表和一棵紅黑樹來管理進(jìn)程中所有的 mm_struct 結(jié)構(gòu)的 mmap 字段就是鏈表的頭節(jié)點(diǎn),而 mm_rb 字段就是紅黑樹的根節(jié)點(diǎn)。

加載程序鏡像

前面我們介紹了 Linux  會(huì)把虛擬內(nèi)存地址劃分為多個(gè) ,并且使用 vm_area_struct 結(jié)構(gòu)來管理這些段。那么,這些虛擬內(nèi)存區(qū)是怎么建立起來的呢?
在介紹進(jìn)程虛擬內(nèi)存區(qū)建立的過程前,我們先來簡單介紹一下 ELF文件格式。

1. ELF文件

ELF 全稱 Executable and Linkable Format,即可執(zhí)行可鏈接文件格式。在 Linux 系統(tǒng)中,就是使用這種文件格式來存儲(chǔ)一個(gè)可執(zhí)行的應(yīng)用程序。讓我們來看一下 ELF 文件格式由哪些結(jié)構(gòu)組成:
一般一個(gè) ELF 文件由以下三部分組成:
  • ELF 頭(ELF header):描述應(yīng)用程序的類型、CPU架構(gòu)、入口地址、程序頭表偏移和節(jié)頭表偏移等等;
  • 程序頭表(Program header table):列舉了所有有效的段(segments)和他們的屬性,程序頭表需要加載器將文件中的段加載到虛擬內(nèi)存段中;
  • 節(jié)頭表(Section header table):包含對節(jié)(sections)的描述。
ELF 文件的結(jié)構(gòu)大概如圖3所示:

當(dāng)內(nèi)核加載一個(gè)應(yīng)用程序時(shí),就是通過讀取 ELF 文件的信息,然后把文件中所有的段加載到虛擬內(nèi)存的段中。ELF 文件通過 程序頭表 來描述應(yīng)用程序中所有的段,表中的每一個(gè)項(xiàng)都描述一個(gè)段的信息。我們先來看看 程序頭表 項(xiàng)的結(jié)構(gòu)定義:
1typedef struct elf64_phdr {
2 Elf64_Word p_type; // 段的類型
3 Elf64_Word p_flags; // 可讀寫標(biāo)志
4 Elf64_Off p_offset; // 段在ELF文件中的偏移量
5 Elf64_Addr p_vaddr; // 段的虛擬內(nèi)存地址
6 Elf64_Addr p_paddr; // 段的物理內(nèi)存地址
7 Elf64_Xword p_filesz; // 段占用文件的大小
8 Elf64_Xword p_memsz; // 段占用內(nèi)存的大小
9 Elf64_Xword p_align; // 內(nèi)存對齊
10} Elf64_Phdr;
所以,程序加載器可以通過 ELF 頭中獲取到程序頭表的偏移量,然后通過程序頭表的偏移量讀取到程序頭表的數(shù)據(jù),再通過程序頭表來獲取到所有段的信息。
我們可以通過 readelf -S file 命令來查看 ELF 文件的段(節(jié))信息,如下圖所示:

上面列出了 代碼段、數(shù)據(jù)段、未初始化數(shù)據(jù)段注釋段 的信息。

2. 加載過程

要加載一個(gè)程序,需要調(diào)用 execve 系統(tǒng)調(diào)用來完成。我們來看看 execve 系統(tǒng)調(diào)用的調(diào)用棧:
1sys_execve
2└→ do_execve
3 └→ do_execveat_common
4 └→ __do_execve_file
5 └→ exec_binprm
6 └→ search_binary_handler
7 └→ load_elf_binary
從上面的調(diào)用者可以看出,execve 系統(tǒng)調(diào)用最終會(huì)調(diào)用 load_elf_binary 函數(shù)來加載程序的 ELF 文件。
由于 load_elf_binary 函數(shù)的實(shí)現(xiàn)比較復(fù)雜,所以我們分段來解說:
(1)讀取并檢查ELF頭
1static int load_elf_binary(struct linux_binprm *bprm, struct pt_regs *regs)
2
{
3 ...
4 struct {
5 struct elfhdr elf_ex;
6 struct elfhdr interp_elf_ex;
7 } *loc;
8
9 loc = kmalloc(sizeof(*loc), GFP_KERNEL);
10 if (!loc) {
11 retval = -ENOMEM;
12 goto out_ret;
13 }
14
15 // 1. 獲取ELF頭
16 loc->elf_ex = *((struct elfhdr *)bprm->buf);
17
18 retval = -ENOEXEC;
19 // 2. 檢查ELF簽名是否正確
20 if (memcmp(loc->elf_ex.e_ident, ELFMAG, SELFMAG) != 0)
21 goto out;
22
23 // 3. 是否是可執(zhí)行文件或者動(dòng)態(tài)庫
24 if (loc->elf_ex.e_type != ET_EXEC
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉