SAS Switch 技術(shù)之基本部署
設(shè)想你公司有成百上千的決策,管理人員,他們工作中需要通過(guò)交換信息,彼此商量來(lái)進(jìn)行緊密配合,你可能會(huì)選擇把公司辦公總部安排在如上海陸家嘴這樣的市中心地點(diǎn)。雖然地價(jià)昂貴,但是便利的地點(diǎn)讓公司能及時(shí)高效地運(yùn)行。又設(shè)想你公司有大量的貨品需要存放轉(zhuǎn)運(yùn),那公司的貨品的倉(cāng)庫(kù)多半會(huì)選擇在遠(yuǎn)郊靠近機(jī)場(chǎng)碼頭地地方,地價(jià)便宜,轉(zhuǎn)運(yùn)方便。
在設(shè)計(jì)計(jì)算機(jī)系統(tǒng)時(shí),人們卻還注意到地價(jià)的概念。而簡(jiǎn)單地認(rèn)為CPU, 內(nèi)存,磁盤(pán)都是對(duì)等的計(jì)算機(jī)部件。其實(shí)地價(jià)在計(jì)算機(jī)系統(tǒng)中也是寸土寸金。簡(jiǎn)單來(lái)說(shuō),越靠近CPU,能提供的I/O聯(lián)接就越高速,廉價(jià),低延遲,因此靠近CPU的物理空間價(jià)值就越高,而離CPU遠(yuǎn)的空間,物理空間的價(jià)值就越低。依次概念,數(shù)據(jù)中心的外部存儲(chǔ),可類(lèi)比為地處遠(yuǎn)郊的數(shù)據(jù)“倉(cāng)庫(kù)”。
典型的刀片服務(wù)器中地價(jià)的概念就十分突出。通常刀片服務(wù)器由一個(gè)具有高速互連背板的多槽位機(jī)框?yàn)橄到y(tǒng)的基礎(chǔ)。通常機(jī)框都價(jià)格不菲。通常廠家都會(huì)提供不同配置的CPU刀片(服務(wù)器結(jié)點(diǎn)),存儲(chǔ)刀片(多盤(pán)位JBOD),和交換刀片供用戶(hù)選擇。不需對(duì)具體產(chǎn)品價(jià)格做計(jì)算,我們光是考慮到刀片服務(wù)器的昂貴地價(jià),就可做如下的簡(jiǎn)單結(jié)論:
1)CPU刀片上最好不要有磁盤(pán),同樣的寶貴空間,配置多些個(gè)CPU, 內(nèi)存條,通常會(huì)更合理。
2)存儲(chǔ)刀片也最好避免購(gòu)買(mǎi),同樣的寶貴槽位,不如留給更有價(jià)值的CPU/交換刀片使用。
3)外部連接個(gè)JBOD來(lái)提供整個(gè)刀片服務(wù)器所有CPU所需要的存儲(chǔ)空間,既經(jīng)濟(jì),又便于擴(kuò)容。
在大型數(shù)據(jù)中心的硬件系統(tǒng)中,同樣的地價(jià)因素也在起作用。下圖說(shuō)明,通過(guò)減少每個(gè)結(jié)點(diǎn)的磁盤(pán)數(shù)目,可以把服務(wù)器的密度成倍提高。從1U位置容納單個(gè)結(jié)點(diǎn),提升為1U2,還可進(jìn)一步提升為1U3, 1U4。目前業(yè)界的最高密度大致每機(jī)架可容納160個(gè)服務(wù)器結(jié)點(diǎn),共320個(gè)CPU, 比傳統(tǒng)的機(jī)架密度提升了4倍以上。
效率的提升,除了在物理空間的更充分利用之外,還合適的封裝邊界內(nèi)帶來(lái)了設(shè)備共享的機(jī)會(huì),比如Facebook 的4個(gè)結(jié)點(diǎn),就可共享同一個(gè)以太網(wǎng)卡,PMC+Intel RSA的參考設(shè)計(jì)中,可在4太服務(wù)器結(jié)點(diǎn)中共享若干個(gè)NVMe SSD。因?yàn)楫?dāng)這些結(jié)點(diǎn)被高密度地封裝在1U的空間中,就可能通過(guò)便宜的PCB連接實(shí)現(xiàn)PCIe的高速互連來(lái)實(shí)現(xiàn)設(shè)備的共享,而不會(huì)引入昂貴的額外線纜成本。
在天蝎2.0機(jī)架中,合作廠商已實(shí)現(xiàn)了插入機(jī)架的SAS Switch, JBOD等具體產(chǎn)品,因此搭建一個(gè)基于SAS Switch的存儲(chǔ)方案已經(jīng)是十分易行:
有了這樣的物理構(gòu)架,如何在一個(gè)機(jī)架上優(yōu)化資源使用效率呢?具體來(lái)說(shuō),部署機(jī)架前如何決定要配置多少服務(wù)器結(jié)點(diǎn),多少JBOD呢?簡(jiǎn)單來(lái)說(shuō),這個(gè)問(wèn)題的答案在于具體應(yīng)用的資源配比特性,其中最重要的一個(gè)就是CPU和盤(pán)的數(shù)目比例??赏ㄟ^(guò)對(duì)應(yīng)用的性能評(píng)測(cè)來(lái)計(jì)算這個(gè)配比的范圍,來(lái)決定設(shè)備的最初部署比例,而在部署后的長(zhǎng)期運(yùn)行過(guò)程中,還個(gè)就每個(gè)CPU的動(dòng)態(tài)運(yùn)行狀態(tài)來(lái)進(jìn)行動(dòng)態(tài)優(yōu)化。
流程如下:
依次基本方法,可在企業(yè)和數(shù)據(jù)中心中部署SAS Switch技術(shù)。