當前位置:首頁 > 廠商動態(tài) > 廠商文章
[導讀]在過去十幾年中,CPU的性能提升了100倍以上,而傳統(tǒng)的HDD硬盤(Hard Disk Drive)才提升了1.5倍不到,這種不均衡的計算存儲技術發(fā)展,極大地影響了IT系統(tǒng)整體性能的提升。

在過去十幾年中,CPU的性能提升了100倍以上,而傳統(tǒng)的HDD硬盤(Hard Disk Drive)才提升了1.5倍不到,這種不均衡的計算存儲技術發(fā)展,極大地影響了IT系統(tǒng)整體性能的提升。直到固態(tài)硬盤SSD(Solid State Drive)被發(fā)明出來,其性能有了顛覆性的提升,才解決了存儲的瓶頸問題。然而,SSD作為一項新技術,仍然存在一些固有的缺陷,如何充分發(fā)揮SSD的優(yōu)勢,是一個值得研究的方向。下面從性能、持久性、使用成本等方面對此話題做一些探討。

一、如何充分發(fā)揮出SSD的性能

首先,我們來看看傳統(tǒng)HDD的使用方式:

1. 協(xié)議一般都采用SAS、SATA接口;

2. Linux的IO調度需要用電梯算法來對IO進行重排以優(yōu)化磁頭的路徑;

3. 企業(yè)級存儲通常使用Raid卡做數據保護。

在接口協(xié)議方面,隨著SSD的發(fā)明,NVMe協(xié)議應運而生。相較于SAS、SATA的單隊列機制,NVMe最多可以有65535個隊列,并且直接采用PCIe接口,消除了鏈路和協(xié)議瓶頸。

在控制卡生態(tài)方面,各大廠商也紛紛推出自己的NVMe控制卡芯片,有PMC(現屬于Microchip)、LSI、Marvel、Intel、慧榮以及國內的得瑞等,技術也已經非常成熟。

在Linux 驅動和IO協(xié)議棧方面,也做了相應的優(yōu)化,如下圖所示,NVMe驅動可以直接繞過那些傳統(tǒng)的、專為HDD設計的調度層,大大縮短了處理路徑。

如何用好你的SSD

到目前為止,為了充分發(fā)揮SSD的性能,上面提到的三個傳統(tǒng)HDD的問題中前兩個已經得到了解決,然而在企業(yè)級市場上,基于NVMe的Raid始終沒有太好的方案。傳統(tǒng)企業(yè)最廣泛使用的Raid5/Raid6數據保護機制(N+1, N+2),通常是把數據條帶化分片,然后計算出冗余的Parity Code(奇偶校驗碼),將數據存放到多塊硬盤,寫入新數據通常是一種“讀改寫”的機制。這種機制本身就成為了性能瓶頸,并且“讀改寫”對SSD的使用壽命有很大的損耗。另外,因為NVMe協(xié)議把控制卡放到了NVMe盤的內部,IO都由NVMe盤內部的DMA模塊來完成,這就給基于NVMe的Raid卡設計帶來了更大的困難。目前市場上這類Raid控制卡可用方案也很少,并且性能上也無法發(fā)揮出NVMe的優(yōu)勢,因此沒能被廣泛使用。

基于目前這種狀況,很多企業(yè)級存儲方案仍然在使用SAS/SATA的SSD加傳統(tǒng)的Raid卡,這種方式又會出現前面已經解決的兩個問題,SSD的性能得不到充分發(fā)揮。

然而,這樣的情況也在發(fā)生改變,由Lightbits Labs發(fā)明的NVMe over TCP(NVMe/TCP)存儲集群解決方案就對這個問題做了很好的處理。該解決方案通過自主研發(fā)的一塊數據加速卡,采用Erasure Code(糾刪碼)機制可以做到超過1M IOPS的隨機寫性能,并且可以避免“讀改寫”帶來的使用壽命損耗。另外,Lightbits提出了Elastic Raid機制,該機制提供彈性的N+1保護(類似于Raid5),相較于傳統(tǒng)的Raid5需要熱備盤或者需要及時替換損壞盤,該機制在一塊硬盤發(fā)生損壞之后能自動平衡形成新的保護。比如一個節(jié)點內原先有10塊盤,采用9+1的保護,當某塊盤損壞后,系統(tǒng)會自動切換成8+1的保護狀態(tài),并且把原先的數據再平衡到新的保護狀態(tài),從而在可維護和數據安全性方面實現了大幅提升。此外,該數據加速卡還能做到100Gb的線速壓縮,顯著提高了可用容量,進而能大幅降低系統(tǒng)使用成本。

二、如何提升NVMe盤的持久性

目前使用最廣泛的SSD是基于NAND顆粒的,而NAND一個與生俱來的問題就是持久性(endurance)。并且隨著技術的發(fā)展,NAND的密度也越來越高,最新一代已經到了QLC(4bits per Cell),同時每個Cell可被擦寫的次數也在減少(1K P/E Cycles)。發(fā)展趨勢如下圖所示。

如何用好你的SSD

另外,對NAND的使用有一個特點,就是可擦的最小單位比較大,如下圖所示,寫的時候可以4KB為單位往里面寫,但是擦的時候(比如修改原有數據)卻只能以256KB為顆粒來操作(不同的SSD大小不一樣,但原理都一樣)。這就容易形成空洞而觸發(fā)SSD的GC(Garbage collection)數據搬移,進而導致所謂的寫放大現象,對盤的持久性會產生進一步影響。

如何用好你的SSD

在企業(yè)級存儲中,通常使用Raid5/6這種“讀改寫”的機制,會對盤的寫操作數量進一步放大,一般使用場景下大約是直接寫入方式的2倍損耗。此外,很多Raid5還會啟動Journal機制,對盤的使用壽命會進一步損耗。

最后,對于最新的QLC來說,使用中還需要考慮另一個因素——Indirection Unit (IU)。比如有些QLC盤使用 16KB的IU,如果要寫入較小的IO,也會觸發(fā)內部“讀改寫”,對使用壽命又多一重損傷。

由此可以看出,基于NAND的SSD還是比較嬌弱的。不過,只要能正確地使用,還是可以避免這些問題。比如以某常用的QLC盤為例,通過如下兩組關于性能和持久性相關的參數可以看出,在持久性上順序寫是隨機寫的5倍,而性能更是26倍:

· 順序寫 0.9 DWPD, 隨機4K寫0.18 DWPD;

· 順序寫 1600 MB/s, 隨機4K寫15K IOPS(60MB/s)。

通過上面的分析發(fā)現,能把盤使用在一個最佳的工作狀態(tài)至關重要。好消息是目前一些先進的解決方案,比如Lightbits的全NVMe集群存儲解決方案就可以解決這個問題。該方案通過把隨機IO變成順序IO的方式,以及獨有的Elastic Raid技術避免了Raid“讀改寫”的弊端,從而能大幅提高盤的持久性及隨機性能。

三、如何降低使用成本

由于SSD相對于HDD而言是一項新技術,再加上產業(yè)的生產規(guī)模和需求量的矛盾,目前價格相比HDD仍然偏高。那么如何降低SSD使用成本就變得非常重要。

降低使用成本最重要的一環(huán)就是要把SSD充分使用起來,無論是容量還是性能。不過就目前而言,大多數NVMe盤都是直接插在應用服務器上使用,而這種方式非常容易造成大量的容量和性能浪費,因為只有這臺服務器上的應用才能使用它。根據調研發(fā)現,使用這種DAS(Direct Attached Storage,直連式存儲)方式,SSD的利用率大概在15%-25%。

針對這個問題比較好的解決方法是近幾年來市場上被廣泛接受的“解耦合”架構。解耦合之后,把所有的NVMe盤變成一個大的存儲資源池,應用服務器用多少就拿多少,只要控制總數量夠用就行,可以非常容易地將利用率推到80%。另外,因為資源集中起來,可以有更多的手段和方法用于降低成本,比如壓縮。例如,平均應用數據壓縮比在2:1,就相當于多了一倍的可用容量,也相當于每GB價格降了一半。當然壓縮本身也會帶來一些問題,比如壓縮本身比較費CPU,另外很多存儲解決方案在開啟壓縮之后性能就會大大降低。

針對壓縮方面的問題,Lightbits的NVMe/TCP集群存儲解決方案可以通過存儲加速卡來予以解決。該卡可以做到100Gb的線速壓縮能力,并且不消耗CPU,不增加延遲。利用這樣的解決方案,壓縮功能幾乎沒有額外的成本。此外,正如前面在介紹提高持久性時所提到的,Lightbits解決方案能提高使用壽命并支持使用QLC盤,從整個使用周期來看,在使用成本方面也會有非常大的降低??偟膩碚f,通過解耦合提高使用效率,壓縮提高可用容量,優(yōu)化提高使用壽命或啟用QLC,經過這樣的重重提升,SSD的使用成本可以得到極大的控制。

以上從性能、持久性、使用成本三個方面分析了如何用好SSD盤,可以看到要用好NVMe SSD盤還是不容易的。因此,對一般用戶而言,選擇一個好的存儲解決方案就至關重要。為此,以色列創(chuàng)新公司Lightbits以充分發(fā)揮NVMe盤的最大價值為使命,發(fā)明了NVMe/TCP協(xié)議,并推出了新一代的全NVMe集群存儲解決方案,可以幫助使用者輕松地將SSD盤用好。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉