大家好,我是你們的老朋友。點(diǎn)進(jìn)這篇文章的朋友,恭喜你們,又要收獲新知識(shí)了~這又是一篇非常硬核的技術(shù)文,建議配合一瓶怡寶或營(yíng)養(yǎng)快線(xiàn)食用,效果更好哦。很多小伙伴在學(xué)操作系統(tǒng)的時(shí)候,學(xué)習(xí)到
內(nèi)存 管理的部分時(shí),都會(huì)接觸到分段內(nèi)存管理、分頁(yè)內(nèi)存管理。
但很多人學(xué)完以后一頭霧水:
到底現(xiàn)在用的是分段還是分頁(yè)?段寄存器這個(gè)東西現(xiàn)在還在用嗎?為什么在講到虛擬地址翻譯的時(shí)候,好像跟段又沒(méi)有關(guān)系了呢? 之所有有這個(gè)問(wèn)題,是因?yàn)楹芏嗤瑢W(xué)看的教程很多都是偏理論的或者是過(guò)時(shí)的,根本不給你講現(xiàn)代操作系統(tǒng)中實(shí)際的情況(關(guān)于這一點(diǎn)我已經(jīng)吐槽很多次了)。今天我就帶大家把內(nèi)存管理的這些疑問(wèn)一次性弄清楚,分段還是分頁(yè),別再傻傻分不清楚了!Let's go!在開(kāi)始之前,我們還是先來(lái)簡(jiǎn)單復(fù)習(xí)一下,操作系統(tǒng)書(shū)上講到的Intel x86 CPU架構(gòu)下的分段式內(nèi)存管理和分頁(yè)式內(nèi)存管理。
分段式內(nèi)存管理 早在16位的8086時(shí)代,CPU為了能尋址超過(guò)16位地址能表示的最大空間(64KB),引入了段寄存器。通過(guò)將內(nèi)存空間劃分為若干個(gè)段,然后采用段基地址 段內(nèi)偏移的方式訪(fǎng)問(wèn)內(nèi)存,這樣能訪(fǎng)問(wèn)1MB的內(nèi)存空間了!
那時(shí)候,段寄存器有4個(gè),分別指向不同的段。
cs: 代碼段 ds: 數(shù)據(jù)段 ss: 棧段 es:擴(kuò)展段 在那個(gè)時(shí)候,段寄存器中存放的是段基地址,注意,是一個(gè)地址。在通過(guò)ip寄存器讀取指令的時(shí)候,實(shí)際上是cs:ip,通過(guò)sp寄存器訪(fǎng)問(wèn)棧的時(shí)候,實(shí)際上是ss:sp。我看到網(wǎng)絡(luò)上很多文章介紹分段式內(nèi)存或者介紹段寄存器的時(shí)候就止步于此了,而事實(shí)上,進(jìn)入32位時(shí)代后,情況已經(jīng)發(fā)生了翻天覆地的變化,只講上面這一部分內(nèi)容實(shí)際上會(huì)誤導(dǎo)很多人。變化1:在32位時(shí)代,段寄存器又增加了兩個(gè):fs、gs,這兩個(gè)段寄存器有特殊用途。變化2:段寄存器里面存放的不再是段基地址,而是一個(gè)叫段選擇子的東西。注意,注意,一切的變化都從這里開(kāi)始。段寄存器是16位的寬度,原來(lái)這16位是個(gè)物理內(nèi)存地址,但現(xiàn)在,它是這樣一個(gè)結(jié)構(gòu):
實(shí)際上,現(xiàn)在的段寄存器中存放的是一個(gè)號(hào)碼,什么號(hào)碼呢?是一個(gè)表格中表項(xiàng)的號(hào)碼,這個(gè)表,有可能是全局描述符表GDT,也有可能是局部描述符表LDT。那到底是哪個(gè)表?是由段選擇子從低到高的第三位來(lái)決定的,如果這一位是0,則是GDT,否則就是LDT。那這兩個(gè)表又是啥,表里面裝的又是什么,怎么來(lái)尋址呢?這兩個(gè)表的表項(xiàng)叫做段描述符,描述了一個(gè)內(nèi)存段的信息,比如段的基地址、最大長(zhǎng)度、訪(fǎng)問(wèn)屬性等等一系列信息,它長(zhǎng)這個(gè)樣子:
CPU中單獨(dú)添置了兩個(gè)寄存器,用來(lái)指向這兩個(gè)表,分別是gdtr和ldtr。在尋址的時(shí)候,CPU首先根據(jù)段寄存器中的號(hào)碼,通過(guò)gdtr或ldtr來(lái)到GDT/LDT中取出對(duì)應(yīng)的段描述符,然后再取出這個(gè)段的基地址,最后再結(jié)合段內(nèi)的偏移,完成內(nèi)存尋址。
也就是說(shuō),在16位模式下,段寄存器中直接就是一個(gè)地址,相當(dāng)于一個(gè)指針,而到了32位下,則變成了一個(gè)句柄,或者說(shuō)二級(jí)指針了。
分頁(yè)式內(nèi)存管理 相比分段式內(nèi)存管理,可能大家對(duì)分頁(yè)式內(nèi)存管理要熟悉的多。操作系統(tǒng)將內(nèi)存空間按照“頁(yè)”為單位劃分了很多頁(yè)面,這個(gè)頁(yè)的大小默認(rèn)是4KB(當(dāng)然可以改的),各進(jìn)程擁有虛擬的完整的地址空間,進(jìn)程中使用到的頁(yè)面會(huì)映射到真實(shí)的物理內(nèi)存上,程序中使用的地址是虛擬地址,CPU在運(yùn)行時(shí)自動(dòng)將其翻譯成真實(shí)的物理地址。
既然要翻譯,那就得有地方記錄虛擬地址和物理地址的映射關(guān)系,只有根據(jù)這個(gè)關(guān)系,才能完成翻譯。這個(gè)映射關(guān)系,是通過(guò)頁(yè)表來(lái)完成的。頁(yè)表是用來(lái)記錄虛擬內(nèi)存頁(yè)面和物理內(nèi)存頁(yè)面之間的映射關(guān)系的,每一個(gè)頁(yè)表項(xiàng)記錄一個(gè)頁(yè)面的映射關(guān)系。但進(jìn)程的地址空間很大,這樣算下來(lái)需要的頁(yè)表項(xiàng)的數(shù)量也會(huì)非常多。而實(shí)際上進(jìn)程地址空間中很多頁(yè)面都沒(méi)有真正使用,也就沒(méi)有映射關(guān)系,這樣是一種浪費(fèi)。為了解決這個(gè)問(wèn)題,CPU引入了多級(jí)頁(yè)表的機(jī)制,在32位下一般是2級(jí)頁(yè)表,像下面這樣:
將虛擬地址劃分了三段:頁(yè)目錄索引、頁(yè)表索引、頁(yè)內(nèi)偏移。線(xiàn)程切換時(shí),如果同時(shí)發(fā)生了進(jìn)程切換,CPU中的CR3寄存器將會(huì)加載當(dāng)前進(jìn)程的頁(yè)目錄地址。在尋址的時(shí)候,通過(guò)CR3,一級(jí)一級(jí)按表索頁(yè),最終找到對(duì)應(yīng)的物理內(nèi)存頁(yè)面,再結(jié)合頁(yè)面內(nèi)的偏移值,實(shí)現(xiàn)最終的內(nèi)存尋址。
現(xiàn)代操作系統(tǒng)實(shí)際情況 學(xué)完了這兩種內(nèi)存管理方式,很多人就要懵了:現(xiàn)在操作系統(tǒng)到底用的哪種方式?好像是分頁(yè),但為什么段寄存器好像還是有,到底是怎么一回事?先說(shuō)結(jié)論,答案就是:分段 分頁(yè)相結(jié)合的內(nèi)存管理方式首先要明確一個(gè)前提,這一點(diǎn)非常非常重要:無(wú)論是分段還是分頁(yè),這都是x86架構(gòu)CPU的內(nèi)存管理機(jī)制,這倆是同時(shí)存在的(保護(hù)模式下),并不是讓操作系統(tǒng)二選一!既然是同時(shí)存在的,那為什么現(xiàn)在將內(nèi)存地址翻譯時(shí),都是講分頁(yè),而很少談到分段呢?這一切的一切,都是因?yàn)橐粋€(gè)原因:操作系統(tǒng)通過(guò)巧妙的設(shè)置,‘屏蔽’了段的存在。操作系統(tǒng)怎么做到這一點(diǎn)的,接下來(lái)我們就來(lái)分析一下,徹底弄清楚背后的貓膩!
段寄存器 讓我們從段寄存器出發(fā),在Win7 32位系統(tǒng)上,使用調(diào)試器(我用的WinDbg)隨意調(diào)試一個(gè)程序,真的,隨意,記事本、瀏覽器、Word,你看上誰(shuí)就調(diào)試誰(shuí)。在中斷的上下文中看一下,程序在執(zhí)行時(shí),段寄存器里面到底裝了啥?
來(lái)看下幾個(gè)主要的段寄存器的內(nèi)容:
cs: 001b ds: 0023 ss: 0023 es: 0023 PS: 可能不同版本的Windows上面的結(jié)果不一樣,但這不重要,不影響我們分析問(wèn)題。只有0x001b和0x0023兩個(gè)值,前面我們說(shuō)了,這不是一個(gè)地址,而是一個(gè)段選擇子,按照段選擇子的格式展開(kāi)來(lái)看一下這兩個(gè)值指向的是哪個(gè)段描述符:
十六進(jìn)制:001b二進(jìn)制:0000000000011 0 11段序號(hào):3 表類(lèi)型:GDT 特權(quán)級(jí):Ring3 十六進(jìn)制:0023二進(jìn)制:0000000000100 0 11段序號(hào):4 表類(lèi)型:GDT 特權(quán)級(jí):Ring3 也就是說(shuō),cs段指向的是GDT中的第3個(gè)表項(xiàng),其他三個(gè)寄存器指向的是GDT中的第4個(gè)表項(xiàng)。接下來(lái),我們來(lái)看一下這個(gè)神秘的GDT里面的內(nèi)容到底是什么?很多人學(xué)了內(nèi)存管理,可能還從來(lái)沒(méi)看過(guò)真實(shí)的GDT里面到底是什么數(shù)據(jù)吧。GDT是位于操作系統(tǒng)內(nèi)核地址空間中的,在Windows上有兩種查看方式,一種是通過(guò)Windbg,一種是通過(guò)一些ARK工具,我這里選擇使用PChunter這個(gè)神器進(jìn)行查看。前面提到過(guò),GDT中的表項(xiàng)是段描述符,這是一個(gè)比較復(fù)雜的數(shù)據(jù)格式,好在,這個(gè)神器對(duì)段描述符進(jìn)行了解析,使用表格字段的方式進(jìn)行了展示,讓我們看起來(lái)輕松多了。廢話(huà)不多說(shuō)了,來(lái)看一下這個(gè)神秘的GDT吧:
注意看第3個(gè)表項(xiàng)和第4個(gè)表項(xiàng)哦,看看它們的基地址,都是
0x00000000
。再看它們的界限值,都是
0x000FFFFF
,注意看這個(gè)界限的單位,不是字節(jié),而是Page——頁(yè),把這個(gè)值乘以頁(yè)面的大小4KB,就是
0xFFFFF000
。也就說(shuō)這個(gè)段的上限到了
0xFFFFF000
這個(gè)頁(yè)面,再把這一個(gè)頁(yè)面的大小加進(jìn)去,就是
0xFFFFFFFF
了!所以,重點(diǎn)來(lái)了!看到了嗎,GDT中的第3個(gè)和第4個(gè)表項(xiàng)所描述的這兩個(gè)段,它們的基地址都是
0x00000000
,整個(gè)段的大小都是
0xFFFFFFFF
,這意味著什么?這意味著整個(gè)進(jìn)程的地址空間實(shí)際上就是一個(gè)段!也就是說(shuō):進(jìn)程的代碼段、數(shù)據(jù)段、棧段、擴(kuò)展段這四個(gè)段全部重合了,而且是整個(gè)進(jìn)程地址空間共計(jì)4GB成為了一個(gè)段。說(shuō)起來(lái)是分段,實(shí)際上等于沒(méi)分了,再加上段的基地址全部是0,那進(jìn)行地址翻譯的時(shí)候,有沒(méi)有段都沒(méi)什么區(qū)別了。總結(jié)一句話(huà):操作系統(tǒng)這樣分段,實(shí)際上是相當(dāng)于把段給架空了!以上是Windows的情況,我們?cè)賮?lái)看一下Linux情況呢。使用GDB隨意調(diào)試一個(gè)ELF32的可執(zhí)行文件,使用info r命令查看一下寄存器情況:
段寄存器有0x23和0x2b兩種情況:
十六進(jìn)制:0023二進(jìn)制:0000000000100 0 11段序號(hào):4 表類(lèi)型:GDT 特權(quán)級(jí):Ring3 十六進(jìn)制:002B二進(jìn)制:0000000000101 0 11段序號(hào):5 表類(lèi)型:GDT 特權(quán)級(jí):Ring3 Linux下我沒(méi)有找到可以直接用什么命令或者工具查看GDT的方式(如果你知道記得一定告訴我哦),于是去源代碼中尋找答案:
看到了嗎,這兩項(xiàng)所描述的段和Windows一樣,基地址為0,大小為4GB。Windows和Linux都選擇了通過(guò)這種方式架空了CPU的分段內(nèi)存管理機(jī)制。但需要說(shuō)明一下的時(shí),雖然兩個(gè)操作系統(tǒng)都是這種情況,但并不意味著段機(jī)制徹底沒(méi)用到,CPU的任務(wù)管理TSS還是需要用到,這一點(diǎn)大家知道就行了。
64位情況 看到操作系統(tǒng)們都不待見(jiàn)這個(gè)分段式內(nèi)存管理,Intel似乎也感受到了這玩意確實(shí)很雞肋,于是到了64位平臺(tái),徹底把段寄存器給打入了冷宮!在Intel的指令手冊(cè)中,關(guān)于64位下的段寄存器是這樣描述的:
不管你的段寄存器中指向的段基址是什么內(nèi)容,都會(huì)被當(dāng)成0來(lái)對(duì)待。這一下,分段內(nèi)存管理,徹底涼涼了···
總結(jié) 好了,最后來(lái)總結(jié)一下。無(wú)論是分段還是分頁(yè),這是CPU自身的機(jī)制,操作系統(tǒng)在管理內(nèi)存時(shí)繞不過(guò)去,但通過(guò)巧妙的分段內(nèi)存設(shè)計(jì),相當(dāng)于把分段的概念給屏蔽了,由此造成了我們平時(shí)在談?wù)撎摂M地址翻譯時(shí),忘記了段的存在,但不代表它真的不存在。CPU硬件層面的工作必須是結(jié)合分段 分頁(yè)的
內(nèi)存 管理機(jī)制,操作系統(tǒng)是軟件繞不過(guò)去,所以采取了上面的方式應(yīng)付CPU了事。從16位到32位再到如今普遍的64位,不同的時(shí)代,分段管理的實(shí)際情況都不一樣,大家在學(xué)習(xí)操作系統(tǒng)的時(shí)候一定不要死記硬背,而要結(jié)合實(shí)際情況哦。現(xiàn)在分段和分頁(yè),你弄清楚了嗎?覺(jué)得有收獲的話(huà),幫忙分享轉(zhuǎn)發(fā)支持一下啊~