當前位置:首頁 > 嵌入式 > 嵌入式教程
[導讀]緩存和RAID如何提高IO

從上一篇文章:IO系統(tǒng)性能之一:衡量性能的幾個指標的計算中我們可以看到一個15k轉速的磁盤在隨機讀寫訪問的情況下IOPS竟然只有140左右,但在實際應用中我們卻能看到很多標有5000IOPS甚至更高的存儲系統(tǒng),有這么大IOPS的存儲系統(tǒng)怎么來的呢?這就要歸結于各種存儲技術的使用了,在這些存儲技術中使用最廣的就是高速緩存(Cache)和磁盤冗余陣列(RAID)了,本文就將探討緩存和磁盤陣列提高存儲IO性能的方法。

  高速緩存(Cache)

  在當下的各種存儲產(chǎn)品中,按照速度從快到慢應該就是內(nèi)存>閃存>磁盤>磁帶了,然而速度越快也就意味著價格越高,閃存雖然說是發(fā)展勢頭很好,但目前來說卻還是因為價格問題無法普及,因此現(xiàn)在還是一個磁盤作霸王的時代。與CPU和內(nèi)存速度相比,磁盤的速度無疑是計算機系統(tǒng)中最大的瓶頸了,所以在必須使用磁盤而又想提高性能的情況下,人們想出了在磁盤中嵌入一塊高速的內(nèi)存用來保存經(jīng)常訪問的數(shù)據(jù)從而提高讀寫效率的方法來折中的解決,這塊嵌入的內(nèi)存就被稱為高速緩存。

  說到緩存,這東西應用現(xiàn)在已經(jīng)是無處不在,從處于上層的應用,到操作系統(tǒng)層,再到磁盤控制器,還有CPU內(nèi)部,單個磁盤的內(nèi)部也都存在緩存,所有這些緩存存在的目的都是相同的,就是提高系統(tǒng)執(zhí)行的效率。

  當然在這里我們只關心跟IO性能相關的緩存,與IO性能直接相關的幾個緩存分別是文件系統(tǒng)緩存(File System Cache)、磁盤控制器緩存(Disk Controller Cache)和磁盤緩存(Disk Cache,也稱為Disk Buffer),不過當在計算一個磁盤系統(tǒng)性能的時候文件系統(tǒng)緩存也是不會考慮在內(nèi)的,因此我們重點考察的就是磁盤控制器緩存和磁盤緩存。

  不管是控制器緩存還是磁盤緩存,他們所起的作用主要是分為三部分:緩存數(shù)據(jù)、預讀(Read-ahead)和回寫(Write-back)。

  緩存數(shù)據(jù)

  首先是系統(tǒng)讀取過的數(shù)據(jù)會被緩存在高速緩存中,這樣下次再次需要讀取相同的數(shù)據(jù)的時候就不用在訪問磁盤,直接從緩存中取數(shù)據(jù)就可以了。當然使用過的數(shù)據(jù)也不可能在緩存中永久保留的,緩存的數(shù)據(jù)一般那是采取LRU算法來進行管理,目的是將長時間不用的數(shù)據(jù)清除出緩存,那些經(jīng)常被訪問的卻能一直保留在緩存中,直到緩存被清空。

  預讀

  預讀是指采用預讀算法在沒有系統(tǒng)的IO請求的時候事先將數(shù)據(jù)從磁盤中讀入到緩存中,然后在系統(tǒng)發(fā)出讀IO請求的時候,就會實現(xiàn)去檢查看看緩存里面是否存在要讀取的數(shù)據(jù),如果存在(即命中)的話就直接將結果返回,這時候的磁盤不再需要尋址、旋轉等待、讀取數(shù)據(jù)這一序列的操作了,這樣是能節(jié)省很多時間的;如果沒有命中則再發(fā)出真正的讀取磁盤的命令去取所需要的數(shù)據(jù)。

  緩存的命中率跟緩存的大小有很大的關系,理論上是緩存越大的話,所能緩存的數(shù)據(jù)也就越多,這樣命中率也自然越高,當然緩存不可能太大,畢竟成本在那兒呢。如果一個容量很大的存儲系統(tǒng)配備了一個很小的讀緩存的話,這時候問題會比較大的,因為小緩存緩存的數(shù)據(jù)量非常小,相比整個存儲系統(tǒng)來說比例非常低,這樣隨機讀取(數(shù)據(jù)庫系統(tǒng)的大多數(shù)情況)的時候命中率也自然就很低,這樣的緩存不但不能提高效率(因為絕大部分讀IO都還要讀取磁盤),反而會因為每次去匹配緩存而浪費時間。

  執(zhí)行讀IO操作是讀取數(shù)據(jù)存在于緩存中的數(shù)量與全部要讀取數(shù)據(jù)的比值稱為緩存命中率(Read Cache Hit Radio),假設一個存儲系統(tǒng)在不使用緩存的情況下隨機小IO讀取能達到150IOPS,而它的緩存能提供10%的緩存命中率的話,那么實際上它的IOPS可以達到150/(1-10%)=166。

  回寫

  首先說一下,用于回寫功能的那部分緩存被稱為寫緩存(Write Cache)。在一套寫緩存打開的存儲中,操作系統(tǒng)所發(fā)出的一系列寫IO命令并不會被挨個的執(zhí)行,這些寫IO的命令會先寫入緩存中,然后再一次性的將緩存中的修改推到磁盤中,這就相當于將那些相同的多個IO合并成一個,多個連續(xù)操作的小IO合并成一個大的IO,還有就是將多個隨機的寫IO變成一組連續(xù)的寫IO,這樣就能減少磁盤尋址等操作所消耗的時間,大大的提高磁盤寫入的效率。

  讀緩存雖然對效率提高是很明顯的,但是它所帶來的問題也比較嚴重,因為緩存和普通內(nèi)存一樣,掉點以后數(shù)據(jù)會全部丟失,當操作系統(tǒng)發(fā)出的寫IO命令寫入到緩存中后即被認為是寫入成功,而實際上數(shù)據(jù)是沒有被真正寫入磁盤的,此時如果掉電,緩存中的數(shù)據(jù)就會永遠的丟失了,這個對應用來說是災難性的,目前解決這個問題最好的方法就是給緩存配備電池了,保證存儲掉電之后緩存數(shù)據(jù)能如數(shù)保存下來。

  和讀一樣,寫緩存也存在一個寫緩存命中率(Write Cache Hit Radio),不過和讀緩存命中情況不一樣的是,盡管緩存命中,也不能將實際的IO操作免掉,只是被合并了而已。

  控制器緩存和磁盤緩存除了上面的作用之外還承當著其他的作用,比如磁盤緩存有保存IO命令隊列的功能,單個的磁盤一次只能處理一個IO命令,但卻能接收多個IO命令,這些進入到磁盤而未被處理的命令就保存在緩存中的IO隊列中。

  RAID(Redundant Array Of Inexpensive Disks)

  如果你是一位數(shù)據(jù)庫管理員或者經(jīng)常接觸服務器,那對RAID應該很熟悉了,作為最廉價的存儲解決方案,RAID早已在服務器存儲中得到了普及。在RAID的各個級別中,應當以RAID10和RAID5(不過RAID5已經(jīng)基本走到頭了,RAID6正在崛起中,看看這里了解下原因)應用最廣了。下面將就RAID0,RAID1,RAID5,RAID6,RAID10這幾種級別的RAID展開說一下磁盤陣列對于磁盤性能的影響,當然在閱讀下面的內(nèi)容之前你必須對各個級別的RAID的結構和工作原理要熟悉才行,這樣才不至于滿頭霧水,推薦查看wikipedia上面的如下條目:RAID,Standard RAID levels,Nested RAID levels。

  RAID0

  RAID0將數(shù)據(jù)條帶化(striping)將連續(xù)的數(shù)據(jù)分散在多個磁盤上進行存取,系統(tǒng)發(fā)出的IO命令(不管讀IO和寫IO都一樣)就可以在磁盤上被并行的執(zhí)行,每個磁盤單獨執(zhí)行自己的那一部分請求,這樣的并行的IO操作能大大的增強整個存儲系統(tǒng)的性能。假設一個RAID0陣列有n(n>=2)個磁盤組成,每個磁盤的隨機讀寫的IO能力都達到140的話,那么整個磁盤陣列的IO能力將是140*n。同時如果在陣列總線的傳輸能力允許的話RAID0的吞吐率也將是單個磁盤的n倍。

   [!--empirenews.page--]

從上一篇文章:IO系統(tǒng)性能之一:衡量性能的幾個指標的計算中我們可以看到一個15k轉速的磁盤在隨機讀寫訪問的情況下IOPS竟然只有140左右,但在實際應用中我們卻能看到很多標有5000IOPS甚至更高的存儲系統(tǒng),有這么大IOPS的存儲系統(tǒng)怎么來的呢?這就要歸結于各種存儲技術的使用了,在這些存儲技術中使用最廣的就是高速緩存(Cache)和磁盤冗余陣列(RAID)了,本文就將探討緩存和磁盤陣列提高存儲IO性能的方法。

  高速緩存(Cache)

  在當下的各種存儲產(chǎn)品中,按照速度從快到慢應該就是內(nèi)存>閃存>磁盤>磁帶了,然而速度越快也就意味著價格越高,閃存雖然說是發(fā)展勢頭很好,但目前來說卻還是因為價格問題無法普及,因此現(xiàn)在還是一個磁盤作霸王的時代。與CPU和內(nèi)存速度相比,磁盤的速度無疑是計算機系統(tǒng)中最大的瓶頸了,所以在必須使用磁盤而又想提高性能的情況下,人們想出了在磁盤中嵌入一塊高速的內(nèi)存用來保存經(jīng)常訪問的數(shù)據(jù)從而提高讀寫效率的方法來折中的解決,這塊嵌入的內(nèi)存就被稱為高速緩存。

  說到緩存,這東西應用現(xiàn)在已經(jīng)是無處不在,從處于上層的應用,到操作系統(tǒng)層,再到磁盤控制器,還有CPU內(nèi)部,單個磁盤的內(nèi)部也都存在緩存,所有這些緩存存在的目的都是相同的,就是提高系統(tǒng)執(zhí)行的效率。

  當然在這里我們只關心跟IO性能相關的緩存,與IO性能直接相關的幾個緩存分別是文件系統(tǒng)緩存(File System Cache)、磁盤控制器緩存(Disk Controller Cache)和磁盤緩存(Disk Cache,也稱為Disk Buffer),不過當在計算一個磁盤系統(tǒng)性能的時候文件系統(tǒng)緩存也是不會考慮在內(nèi)的,因此我們重點考察的就是磁盤控制器緩存和磁盤緩存。

  不管是控制器緩存還是磁盤緩存,他們所起的作用主要是分為三部分:緩存數(shù)據(jù)、預讀(Read-ahead)和回寫(Write-back)。

  緩存數(shù)據(jù)

  首先是系統(tǒng)讀取過的數(shù)據(jù)會被緩存在高速緩存中,這樣下次再次需要讀取相同的數(shù)據(jù)的時候就不用在訪問磁盤,直接從緩存中取數(shù)據(jù)就可以了。當然使用過的數(shù)據(jù)也不可能在緩存中永久保留的,緩存的數(shù)據(jù)一般那是采取LRU算法來進行管理,目的是將長時間不用的數(shù)據(jù)清除出緩存,那些經(jīng)常被訪問的卻能一直保留在緩存中,直到緩存被清空。

  預讀

  預讀是指采用預讀算法在沒有系統(tǒng)的IO請求的時候事先將數(shù)據(jù)從磁盤中讀入到緩存中,然后在系統(tǒng)發(fā)出讀IO請求的時候,就會實現(xiàn)去檢查看看緩存里面是否存在要讀取的數(shù)據(jù),如果存在(即命中)的話就直接將結果返回,這時候的磁盤不再需要尋址、旋轉等待、讀取數(shù)據(jù)這一序列的操作了,這樣是能節(jié)省很多時間的;如果沒有命中則再發(fā)出真正的讀取磁盤的命令去取所需要的數(shù)據(jù)。

  緩存的命中率跟緩存的大小有很大的關系,理論上是緩存越大的話,所能緩存的數(shù)據(jù)也就越多,這樣命中率也自然越高,當然緩存不可能太大,畢竟成本在那兒呢。如果一個容量很大的存儲系統(tǒng)配備了一個很小的讀緩存的話,這時候問題會比較大的,因為小緩存緩存的數(shù)據(jù)量非常小,相比整個存儲系統(tǒng)來說比例非常低,這樣隨機讀取(數(shù)據(jù)庫系統(tǒng)的大多數(shù)情況)的時候命中率也自然就很低,這樣的緩存不但不能提高效率(因為絕大部分讀IO都還要讀取磁盤),反而會因為每次去匹配緩存而浪費時間。

  執(zhí)行讀IO操作是讀取數(shù)據(jù)存在于緩存中的數(shù)量與全部要讀取數(shù)據(jù)的比值稱為緩存命中率(Read Cache Hit Radio),假設一個存儲系統(tǒng)在不使用緩存的情況下隨機小IO讀取能達到150IOPS,而它的緩存能提供10%的緩存命中率的話,那么實際上它的IOPS可以達到150/(1-10%)=166。

  回寫

  首先說一下,用于回寫功能的那部分緩存被稱為寫緩存(Write Cache)。在一套寫緩存打開的存儲中,操作系統(tǒng)所發(fā)出的一系列寫IO命令并不會被挨個的執(zhí)行,這些寫IO的命令會先寫入緩存中,然后再一次性的將緩存中的修改推到磁盤中,這就相當于將那些相同的多個IO合并成一個,多個連續(xù)操作的小IO合并成一個大的IO,還有就是將多個隨機的寫IO變成一組連續(xù)的寫IO,這樣就能減少磁盤尋址等操作所消耗的時間,大大的提高磁盤寫入的效率。

  讀緩存雖然對效率提高是很明顯的,但是它所帶來的問題也比較嚴重,因為緩存和普通內(nèi)存一樣,掉點以后數(shù)據(jù)會全部丟失,當操作系統(tǒng)發(fā)出的寫IO命令寫入到緩存中后即被認為是寫入成功,而實際上數(shù)據(jù)是沒有被真正寫入磁盤的,此時如果掉電,緩存中的數(shù)據(jù)就會永遠的丟失了,這個對應用來說是災難性的,目前解決這個問題最好的方法就是給緩存配備電池了,保證存儲掉電之后緩存數(shù)據(jù)能如數(shù)保存下來。

  和讀一樣,寫緩存也存在一個寫緩存命中率(Write Cache Hit Radio),不過和讀緩存命中情況不一樣的是,盡管緩存命中,也不能將實際的IO操作免掉,只是被合并了而已。

  控制器緩存和磁盤緩存除了上面的作用之外還承當著其他的作用,比如磁盤緩存有保存IO命令隊列的功能,單個的磁盤一次只能處理一個IO命令,但卻能接收多個IO命令,這些進入到磁盤而未被處理的命令就保存在緩存中的IO隊列中。

  RAID(Redundant Array Of Inexpensive Disks)

  如果你是一位數(shù)據(jù)庫管理員或者經(jīng)常接觸服務器,那對RAID應該很熟悉了,作為最廉價的存儲解決方案,RAID早已在服務器存儲中得到了普及。在RAID的各個級別中,應當以RAID10和RAID5(不過RAID5已經(jīng)基本走到頭了,RAID6正在崛起中,看看這里了解下原因)應用最廣了。下面將就RAID0,RAID1,RAID5,RAID6,RAID10這幾種級別的RAID展開說一下磁盤陣列對于磁盤性能的影響,當然在閱讀下面的內(nèi)容之前你必須對各個級別的RAID的結構和工作原理要熟悉才行,這樣才不至于滿頭霧水,推薦查看wikipedia上面的如下條目:RAID,Standard RAID levels,Nested RAID levels。

  RAID0

  RAID0將數(shù)據(jù)條帶化(striping)將連續(xù)的數(shù)據(jù)分散在多個磁盤上進行存取,系統(tǒng)發(fā)出的IO命令(不管讀IO和寫IO都一樣)就可以在磁盤上被并行的執(zhí)行,每個磁盤單獨執(zhí)行自己的那一部分請求,這樣的并行的IO操作能大大的增強整個存儲系統(tǒng)的性能。假設一個RAID0陣列有n(n>=2)個磁盤組成,每個磁盤的隨機讀寫的IO能力都達到140的話,那么整個磁盤陣列的IO能力將是140*n。同時如果在陣列總線的傳輸能力允許的話RAID0的吞吐率也將是單個磁盤的n倍。

  

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉