當(dāng)前位置:首頁 > 公眾號精選 > IOT物聯(lián)網(wǎng)小鎮(zhèn)
[導(dǎo)讀]作?者:道哥,10年嵌入式開發(fā)老兵,專注于:C/C、嵌入式、Linux。關(guān)注下方公眾號,回復(fù)【書籍】,獲取Linux、嵌入式領(lǐng)域經(jīng)典書籍;回復(fù)【PDF】,獲取所有原創(chuàng)文章(PDF格式)。目錄問題描述CPU接收的是線性地址,不是物理地址對頁目錄進(jìn)行"自操作"一級查表:構(gòu)造線性地址的...

作  者:道哥,10 年嵌入式開發(fā)老兵,專注于:C/C 、嵌入式、Linux。


關(guān)注下方公眾號,回復(fù)【書籍】,獲取 Linux、嵌入式領(lǐng)域經(jīng)典書籍;回復(fù)【PDF】,獲取所有原創(chuàng)文章( PDF 格式)。



目錄


  • 問題描述


    • CPU接收的是線性地址,不是物理地址


  • 對頁目錄進(jìn)行"自操作"


    • 一級查表:構(gòu)造線性地址的前十位


    • 二級查表:構(gòu)造線性地址的中間十位


    • 三級查表:構(gòu)造線性地址的最后十二位


    • 三個地址段合體


  • 對頁表進(jìn)行"自操作"


在x86系統(tǒng)中,內(nèi)存管理中的分頁機(jī)制是非常重要的,在Linux操作系統(tǒng)相關(guān)的各種書籍中,這部分內(nèi)容也是重筆濃彩。


如果你看過Linux內(nèi)核相關(guān)書籍,一定對下面這張圖又熟悉、又恐懼:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?這是Linux系統(tǒng)中,頁處理單元的多級頁表查詢方式。


其中黃色背景部分:頁上級目錄索引 和 頁中間目錄索引,是 Linux 系統(tǒng)自己擴(kuò)展的,在原本的x86處理器中是不存在的,這也是導(dǎo)致Linux中相關(guān)部分代碼更加復(fù)雜的原因。


在上一篇文章中,我們主要對x86中的頁目錄和頁表的“反向構(gòu)造”、“正向查找”這兩個過程進(jìn)行了圖文并茂的討論。文章鏈接在此:Linux從頭學(xué)15:【頁目錄和頁表】-理論 實例 圖文的最完全、最接地氣詳解!,但是其中有一個環(huán)節(jié)被特意忽略過去了。


那就是:在操作系統(tǒng)構(gòu)造頁目錄和頁表的時候,如何對它們自身進(jìn)行尋址和操作?


這部分內(nèi)容,也是內(nèi)存管理中比較復(fù)雜的地方,就好比一名醫(yī)生給病人做手術(shù),但是病人卻是“醫(yī)生自己”。


這篇文章,我們繼續(xù)通過圖片 實例的方式,一起來研究一下內(nèi)核代碼一般都是如何來進(jìn)行這些“自操作”的。


把這里面的操作機(jī)制研究透徹之后,再去看Linux內(nèi)核代碼時,就不會暈頭轉(zhuǎn)向了。


問題描述

在上一篇文章中,我們舉了這樣一個示例:


  1. 假設(shè)實際的物理內(nèi)存是1 GB;


  2. 用戶程序文件在硬盤上的長度是20 MB;


  3. 操作系統(tǒng)把用戶程序加載到內(nèi)存中時,從 0x4000_0000 的虛擬內(nèi)存地址處開始存放;


  4. 操作系統(tǒng)讀取程序結(jié)束后,為所有的地址構(gòu)造好了頁目錄和頁表;


如下圖所示:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?頁目錄和頁表的每一個有效表項中,存儲的地址都是一個個實實在在的物理頁的前 20 位(因為一個物理頁的長度固定是4KB,在分配時都是對齊的,末尾的 12 位全部為 0)。


并且頁目錄和頁表“們”自身,都占用一個物理頁的空間,所以它們都有自己的物理地址。


當(dāng)頁目錄和頁表都構(gòu)造妥當(dāng)之后,處理器面對一個線性地址,例如:0x4100_1800,頁處理單元就會按照分級查表的方式,把這個線性地址轉(zhuǎn)換為一個物理地址:


  1. 拆分線性地址:0x4100_1800 = 0100_0001_0000_0000___0001_1000_0000_0000;


  2. 根據(jù)線性地址的前 10 位,找到頁目錄中的索引 260,從而確定頁表的物理地址是 0x0800_4000(表項中的值是 0x08004,還要補上低位的 12 個 0);


  3. 根據(jù)線性地址的中間 10 位,找到 0x0800_4000 這個頁表中的索引 1,從而確定普通物理頁的物理地址是 0x0210_1000(表項中的值是 0x02101,還要補上低位的 12 個 0);


  4. 根據(jù)線性地址的最后 12 位,確定普通頁內(nèi)的偏移量是 2048,普通頁的開始地址加上這個偏移量,就得到了最終的物理地址 0x0210_1800。


詳細(xì)的討論過程,請參考上一篇文章:Linux從頭學(xué)15:【頁目錄和頁表】-理論 實例 圖文的最完全、最接地氣詳解!。


那么,問題來了:


在頁處理單元開啟的情況下,處理器面對的是線性地址,那么操作系統(tǒng)在構(gòu)造頁目錄中的每一個表項的時候,如何對這個表項進(jìn)行尋址?


具體到上圖來說就是:操作系統(tǒng)想把第一個頁表的物理地址0x0800_0000,填寫到頁目錄的第256個表項中時,那么CPU就需要找到這個表項,這個表項肯定有物理地址的。


但是,我們不能把這個表項的物理地址直接告訴CPU,因為CPU只接收線性地址,它會自動經(jīng)過分頁單元的處理來得到對應(yīng)的物理地址。


那么,這個線性地址的值應(yīng)該是多少呢?


繼續(xù)用實例來說明,這樣容易理解。


假設(shè)頁目錄所處的物理頁開始地址是0x0100_0000,那么第256個表項的物理地址就是0x0100_0400。


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?有些小伙伴可能會說:直接把物理地址0x0100_0400告訴處理器,不就可以了嗎?


這是不對的


處理器接收的是線性地址,不是物理地址

因為現(xiàn)在已經(jīng)開啟了分頁處理單元,0x0100_0400是我們最后想得到的物理地址,而處理器只接受線性地址,雖然我們知道這是一個物理地址,但是處理器不知道??!


當(dāng)我們給處理器一個地址的時候,處理器會按部就班的對這個地址進(jìn)行[段轉(zhuǎn)換],再進(jìn)行[頁轉(zhuǎn)換],這時才得到它認(rèn)為的物理地址。


由于使用的是“平坦型”的段結(jié)構(gòu),所以這里就忽略了段處理過程,直接討論頁處理過程。


所以,我們應(yīng)該使用某些方法,構(gòu)造出一個線性地址 addr,讓這個地址經(jīng)過頁處理單元之后,得到0x0100_0400這個物理地址:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?這里有點遞歸的味道,又有點像一個醫(yī)生給他自己做一個外科手術(shù)!


現(xiàn)在,應(yīng)該明白面對的問題了吧?


目標(biāo)就是:通過某種方法,構(gòu)造出一個線性地址addr,并且通過頁處理單元轉(zhuǎn)換之后,得到物理地址0x0100_0400。


對頁目錄進(jìn)行操作

重新梳理一下思路:如果對一個普通物理頁(下文簡稱為:普通頁)里的一個地址處的數(shù)據(jù)進(jìn)行操作,需要經(jīng)過3次查表操作:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?從頁表的某個表項中,找到的那個物理地址,就是最后要操作的普通物理頁。


現(xiàn)在我們的問題是:需要把頁目錄作為最終的操作對象。


也就是說,從頁表中找到的“普通頁”的物理地址,應(yīng)該等于頁目錄的物理地址!


作為一名軟件開發(fā)人員,遞歸思想都是有的。


我們就來構(gòu)造一個線性地址 addr,讓它經(jīng)過3次查表操作之后,能夠指向頁目錄的物理地址。


一級查表:構(gòu)造線性地址的前 10 位,來確定頁表的物理地址

一級查表:查找的對象是頁目錄。


線性地址addr的前10位,決定了頁目錄內(nèi)的索引。


很顯然,需要讓這個索引對應(yīng)的那個表項中所登記的地址,必須是指向頁目錄自己才可以。


常用的解決方案是:利用頁目錄中的最后一個表項,讓這個表項中記錄的地址,指向頁目錄自己,如下圖所示:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?也就是說,預(yù)先在頁目錄的最后一個表項中,填入頁目錄自己的物理地址,然后只要線性地址addr前10位的值為1023,就能夠得到這個表項。


很容易就能得到addr的前10位應(yīng)該是:0x3FF(二進(jìn)制:1111_1111_11)。


由于這個表項中存儲的地址是頁目錄自己的開始地址(0x0100_0000, 最后的12個0是自動補上的),這樣就相當(dāng)于:下面進(jìn)入第二級查找時,頁目錄即將被當(dāng)做“頁表”來使用


如下圖所示:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?這里紅色虛線的“頁表”其實就是頁目錄自己,只是一個影子而已。


二級查表:構(gòu)造線性地址的中間 10 位,來確定“普通頁”的物理地址

二級查表:查找的對象是頁表,也就是一級查表得到的那個“頁表”


雖然一級查表的結(jié)果是頁目錄自己,但是處理器不管這些,它會把這個表當(dāng)做頁表來使用。


現(xiàn)在,來考慮線性地址addr的中間10位,它決定了頁表中的索引號。


很顯然,需要繼續(xù)讓這個索引號對應(yīng)的那個表項中,記錄的地址必須繼續(xù)指向頁目錄自己。


那就繼續(xù)利用這個“頁表”(其實它是頁目錄)中的最后一個表項唄,就是index = 1023的這個表項。


這個表項中存儲的物理地址,即將是最終查表得到的“普通頁”的物理地址了。


由于這個表項中,被預(yù)先填寫了0x01000,補上尾部的12個0之后就是0x0100_0000,仍然指向頁目錄自己,完美!


于是,就得到了中間10位的結(jié)果:0x3FF(二進(jìn)制:11_1111_1111)。


如下圖所示:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?最右面紅色虛線的“物理頁”,就是二級查找的結(jié)果,它本質(zhì)上仍然是頁目錄本身,只不過它即將被當(dāng)做一個普通物理頁來使用。


三級查表:構(gòu)造線性地址的最后 12 位,來確定“普通頁”的頁內(nèi)偏移量

現(xiàn)在,已經(jīng)構(gòu)造出了線性地址addr(這是我們的最終目標(biāo))的前20位,并且經(jīng)過頁表的前兩級查表,成功的定位到了頁目錄自己!


就差最后一步了!


我們知道,從線性地址到物理地址的轉(zhuǎn)換過程中,最后的12位表示頁內(nèi)偏移,是直接從線性地址中取過來的。


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?也就是說:線性地址 與 物理地址 的最后12位偏移量,值是一樣的!


所以,我們就反過來倒推一下:


我們最終想操作的是頁目錄中第256個表項,它的物理地址是0x0100_0400,這個物理地址距離這個頁目錄開始位地址的偏移量是:0x400(0x0100_0400減去0x0100_0000)。


因此,線性地址addr中的最后12位的值也應(yīng)該是0x400。


三個地址段合體

把上面三個步驟中,得到的地址聚合在一起:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?0xFFFF_F400就是最終想得到的線性地址!


也就是說,我們只要把這個線性地址0xFFFF_F400告訴處理器,它就會經(jīng)過頁處理單元的轉(zhuǎn)換,最終查找到頁目錄這個物理頁中的第256個表項,也就是物理地址 0x0100_0400。


例如:mov [0xFFFF_4000], xxxx


以上就是操作系統(tǒng)在操作頁目錄自身時,所采取的策略。


具體到每個操作系統(tǒng)來說,可能稍微有差別,但是其中的道理都是差不多的。


例如本文開頭的第一張圖中,Linux使用了4級表格來查找,并且中間的兩個表格還可以省略不用。


如何跨過中間的這兩個表格,Linux內(nèi)核代碼中的代碼更復(fù)雜一些,但是策略都是一樣的。


對頁表進(jìn)行尋址

既然已經(jīng)弄明白了操作系統(tǒng)是如何操作頁目錄的,那么對頁表的操作就不是什么大問題了。


比如下面這張圖:


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?目標(biāo):把最右面的普通物理頁地址0x0200_0000,放入0x0800_0000這個頁表的第一個表項中(只需要存儲前20位),那么應(yīng)該傳遞什么樣的線性地址給處理器?


思路是完全一樣的。


一級查表

按照正常的分頁查找流程,從頁目錄的某個表項中,查找我們想操作的那個頁表。


頁目錄中的這個表項位于索引值256的地方,因此可以構(gòu)造出線性地址的前10位是:0100_0000_00(0x100)。


所以,經(jīng)過一級查表得到的這個頁表的物理地址是0x0800_0000。


二級查表

利用這個頁表的最后一個表項(index = 1023),預(yù)先填寫一個地址(0x08000),讓它指向這個頁表自己的開始物理地址。


于是,可以構(gòu)造出線性地址的中間10位是:11_1111_1111(0x3FF)。


由于這個表項中存儲的地址是0x0800_0000,指向的正是頁表自己,只不過馬上它就被當(dāng)作普通物理頁被使用。


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?

三級查表

此時,已經(jīng)找到最后的普通物理頁了(其實它是一個頁表,被當(dāng)作普通物理頁使用)。


線性地址的最后12位,可以直接從最后想操作的那個目標(biāo)物理地址中最后12位直接拿過來。


我們的目標(biāo)是:操作頁表中的第 0 個表項,這個表項的物理地址是0x0800_0000,最后的12位偏移量是0000_0000_0000。


把以上3個地址段合體,即可得到正確的線性地址


Linux從頭學(xué)16:操作系統(tǒng)-如何把【頁目錄和頁表】當(dāng)做普通物理頁進(jìn)行操作的?
------ End ------


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉