虛擬內(nèi)存，MMU/TLB，PAGE，Cache之間關(guān)系

時間：2019-07-10 10:31:02

關(guān)鍵字：虛擬內(nèi)存

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]虛擬地址VA到物理地址PA以頁page為單位。通常page的大小為4K。物理頁面成為page frame。查看應(yīng)用程序進程的地址空間，可以看到分為很多段，比如代碼段（只讀）、數(shù)據(jù)段（讀寫）、堆、共享庫

虛擬地址VA到物理地址PA以頁page為單位。通常page的大小為4K。物理頁面成為page frame。

查看應(yīng)用程序進程的地址空間，可以看到分為很多段，比如代碼段（只讀）、數(shù)據(jù)段（讀寫）、堆、共享庫（其中進一步分段）、?？臻g等。整個應(yīng)用程序的地址空間不會用滿4GB，因為還有一部分是內(nèi)核空間，應(yīng)用程序不能訪問。
再打開一個相同的應(yīng)用程序查看其進程的地址空間，也是類似的，甚至是一樣的。因為采用采用了虛擬地址，經(jīng)過轉(zhuǎn)換在物理地址上還是分開的。（代碼段可能沒有分開，因為可以共用）

采用虛擬內(nèi)存的原因：
1.讓每個進程有獨立的地址空間，一個好處是某個進程不會破壞其他進程，另一個好處是每個進程都認為有4GB地址空間，編程方便。
2.物理上分開地址空間，經(jīng)過虛擬內(nèi)存的管理，可以使得邏輯上是連續(xù)的。
3.所有進程的虛擬內(nèi)存之和可能大于物理內(nèi)存。這是通過借用磁盤來實現(xiàn)的，將一時不用的虛擬內(nèi)存保持到磁盤。磁盤上這部分成為交換設(shè)備，可以是分區(qū)，也可以是一個文件。所以系統(tǒng)中可分配的內(nèi)存總量 = 物理內(nèi)存的大小 + 交換設(shè)備的大小。交換的過程成為頁的換入和換出，期間需要對內(nèi)存重新映射。
4.增加內(nèi)存的保護屬性，如內(nèi)核地址空間、只讀地址空間等。

虛擬地址到物理地址是一個查表的過程，但可能不只一個表，是一個多級的表。虛擬地址本身分為幾個部分，page地址和page內(nèi)地址（對于4KB的頁來說就是11bit），page地址分為多級用于查表。這個過程稱為Translation Table Walk，由硬件完成。上述所指的表，是保存在內(nèi)存上的。

page大，page table??；
page大，減少TLB的miss；
page大，分配memory容易造成浪費；

上圖給出了CPU，MMU，Cache的布局，MMU應(yīng)該包括了TLB和Translation Table Walk。TLB（Translation Lookaside Buffer）是一塊高速緩存，緩存最近查找過的VA對應(yīng)的頁表項。如果TLB中有需要查表的VA，就不用Translation Table Walk了，Translation Table Walk較慢要從內(nèi)存上讀表。

Cache的儲存單位是line，假設(shè)每個line有32bytes。為了表示某個line是屬于哪個VA的，Cache里還有TAG。最簡單的TAG就是VA的地址了（按32bytes的line對齊），Cache控制器檢查CPU給出VA和TAG是否一致，一致的話表示命中（Hit），將數(shù)據(jù)返回給CPU，否則的話靠MMU轉(zhuǎn)成PA從內(nèi)存中讀取數(shù)據(jù)。

上述這個Cache的設(shè)計稱為全相聯(lián)，特點是一個VA可以緩存到任何line里，但問題是Cache可能有很多l(xiāng)ine，比如512個line，每次都需要一個個TAG比較過來，這樣速度較慢。
另一種Cache的設(shè)計稱為直接映射，特定的VA只能存在特定的Cache line里，映射規(guī)則為Cache line = （VA line）%（Cacle line總數(shù)）。這樣的問題是Cache line里的數(shù)據(jù)進出可能太過于平凡，導(dǎo)致命中率較低。

全相聯(lián)Cache和直接映射Cache各有優(yōu)缺點，全相聯(lián)Cache查找很慢，但沒有抖動問題（命中率低），直接映射Cache則正相反。實際CPU的Cache設(shè)計是取兩者的折衷，把所有Cache Line分成若干個組，每一組有n條Cache Line，稱為n路組相聯(lián)Cache（n-way Set Associative Cache）。n路組相聯(lián)Cache的特點是特定的內(nèi)存行只能放在特定的組內(nèi)，但是可以放在組內(nèi)的任意cache line上。
?? ??? ?
Cache寫回內(nèi)存有兩種模式：
Write Back：Cache Line中的數(shù)據(jù)被CPU核修改時并不立刻寫回內(nèi)存，Cache Line和內(nèi)存中的數(shù)據(jù)會暫時不一致，在Cache Line中有一個Dirty位標記這一情況。當(dāng)一條Cache Line要被其它VA的數(shù)據(jù)替換時，如果不是Dirty的就直接替換掉，如果是Dirty的就先寫回內(nèi)存再替換。

Write Through：每當(dāng)CPU核修改Cache Line中的數(shù)據(jù)時就立刻寫回內(nèi)存，Cache Line和內(nèi)存中的數(shù)據(jù)總是一致的。如果有多個CPU或設(shè)備同時訪問內(nèi)存，例如采用雙口RAM，那么Cache中的數(shù)據(jù)和內(nèi)存保持一致就非常重要了，這時相關(guān)的內(nèi)存頁面通常配置為Write Through模式。

?? ?
?? ?page是os的概念，而cache是cpu的概念。虛擬地址和物理地址以page為單位進行操作的，由兩部分組成：page地址和page內(nèi)地址：

??? 采用多路組聯(lián)的cache，如之前所述，這樣的Cache分為多個set（組），每個組里面又有多個line/way（行），每個line里面又有多個字節(jié)。

對某個page進行操作時，會將page分配到cache里，這種分配是按照一定關(guān)系的。
?? ?
?? ?假設(shè)page的大小為4KB，考慮物理地址；
?? ?cache的大小為2M，16384個4-Way SET，32 Bytes line，即32*4*16384=2M。
?? ?執(zhí)行memset（0, 0, 4*1024）的話，這4KB內(nèi)存在cache上會放在連續(xù)的0到127set中每個set的第1個line；
?? ?執(zhí)行memset（1, 0, 4*1024）的話，這4KB內(nèi)存在cache上會放在連續(xù)的128到255set中每個set的第1個line；
?? ?...
?? ?執(zhí)行memset（128, 0, 4*1024）的話，這4KB內(nèi)存在cache上會放在連續(xù)的0到127set中每個set的第2個line；
?? ?執(zhí)行memset（129, 0, 4*1024）的話，這4KB內(nèi)存在cache上會放在連續(xù)的128到255set中每個set的第2個line；
?? ?
?? ?就是說第ith物理頁面會與第(128*j+i)th個物理頁面中Cache中占據(jù)同樣的Cache Sets。Set滿了之后，按照一定的算法，比如LRU算法（Least Recently Used algorithm）清除之前的數(shù)據(jù)。
?

??? 以上說的是現(xiàn)象，產(chǎn)生上述現(xiàn)象的原因可以用下圖來解釋：
???

??? 物理地址的位5-11是page中的偏移地址，7位，可以表示128個set；
?? ?物理地址的位12-31是page frame地址的，對某一個page來說是固定的，決定了上述128個set在cache中的位置。
?? ?
?? ?128個set的合集有個專用的名詞，稱為Cache Bin。