浪潮信息M6服務(wù)器極限性能挑戰(zhàn) 破解毫厘之間散熱"湍流"玄謎
北京2022年6月9日 /美通社/ --
狹小,不到0.002立方米空間內(nèi);
氣流,被每秒500轉(zhuǎn)的風(fēng)扇擾動(dòng);
瞬間,所有電氣組件變?yōu)槟μ齑髽牵?br />極限,硬盤數(shù)據(jù)接近滿載;
此時(shí),硬盤讀寫頭以10納米的距離,懸浮于盤片之上……
硬盤正在經(jīng)歷一項(xiàng)極致嚴(yán)苛的性能與可靠性測(cè)試——服務(wù)器工作環(huán)境溫度已經(jīng)超過數(shù)據(jù)中心環(huán)境溫度標(biāo)準(zhǔn),與此同時(shí)內(nèi)部一臺(tái)散熱風(fēng)扇停止工作,要求服務(wù)器仍然能正常運(yùn)轉(zhuǎn),硬盤的讀寫性能依舊在線,以保障在這類極小概率出現(xiàn)的業(yè)務(wù)場(chǎng)景中硬盤數(shù)據(jù)的安全,性能的穩(wěn)定。但在極限測(cè)試中,浪潮信息工程師發(fā)現(xiàn),在對(duì)于硬盤進(jìn)行接近滿載的高負(fù)荷壓力測(cè)試時(shí),硬盤的穩(wěn)定性猶如在亂風(fēng)中飛舞的柳絮飄忽不定,甚至還出現(xiàn)了徹底報(bào)廢的極端故障。
硬盤內(nèi)部:讀寫頭在在碟片上方“飛行” 尋找碟片磁道從而讀寫數(shù)據(jù) 飛行高度約為10納米,相當(dāng)于大型飛機(jī)沿著地面3cm的高度穩(wěn)定飛行
面對(duì)數(shù)據(jù)中心數(shù)據(jù)計(jì)算量的幾何級(jí)增長,這種看似在罕見場(chǎng)景、極限測(cè)試才出現(xiàn)的故障問題,也不能輕易忽視,必須要找到"神隱"背后的問題根源。
尋找毫厘之間的玄謎!一個(gè)好消息、一個(gè)壞消息?
為了揭開硬盤讀寫性能下降的謎題,浪潮信息工程師首先針對(duì)服務(wù)器的關(guān)鍵組件進(jìn)行逐一篩查,替換了不同的風(fēng)扇、硬盤、內(nèi)部主板以及背部連接器等進(jìn)行對(duì)比分析,但問題依然存在。工程師又結(jié)合定量分析,改變環(huán)境溫度、調(diào)節(jié)風(fēng)扇轉(zhuǎn)速等等進(jìn)行了大量的實(shí)驗(yàn)測(cè)試,終于發(fā)現(xiàn)每當(dāng)風(fēng)扇轉(zhuǎn)速達(dá)3萬轉(zhuǎn)/分鐘,服務(wù)器的硬盤讀寫性能就開始下降。
基于這一發(fā)現(xiàn),結(jié)構(gòu)仿真、流體仿真等多個(gè)團(tuán)隊(duì)協(xié)同合作,找到了問題的答案——當(dāng)散熱風(fēng)扇轉(zhuǎn)速達(dá)到3萬轉(zhuǎn)的極限轉(zhuǎn)速時(shí),系統(tǒng)風(fēng)扇進(jìn)風(fēng)端形成的湍流,即氣流漩渦,會(huì)存在于硬盤和風(fēng)扇之間的空間,而硬盤是精密度很高的部件,對(duì)湍流信號(hào)感知非常敏感,不規(guī)則的湍流可能會(huì)給硬盤性能帶來巨大的影響。輕則影響硬盤磁頭讀寫性能下降,嚴(yán)重則會(huì)硬盤報(bào)廢,導(dǎo)致數(shù)據(jù)丟失。
風(fēng)扇入口因氣流受阻形成湍流
引起"湍流"的散熱風(fēng)扇是保障服務(wù)器計(jì)算性能和散熱的核心部件之一,但極限轉(zhuǎn)速的風(fēng)扇所產(chǎn)生的"湍流"又會(huì)影響硬盤的性能和可靠性,浪潮信息工程師需要尋找性能與散熱極致平衡的方法,讓計(jì)算性能、散熱、可靠性達(dá)到和諧統(tǒng)一。
問題雖然得已鎖定,但工程師們欣喜之下,又不得不去面對(duì)一個(gè)壞消息——能否有效治理"湍流"是數(shù)學(xué)屆的千禧年7大難題之一。浪潮信息工程師要做的就是尋找破解風(fēng)扇高速轉(zhuǎn)動(dòng)而產(chǎn)生湍流效應(yīng)的方法。
破解"湍流" 意外破"圈"帶來驚喜
想要有效的破解"湍流",就意味著要讓雜亂的"湍流"變成平穩(wěn)的"層流"。在項(xiàng)目組百思不得其解的時(shí)候,浪潮信息工程師在參與FAST天眼項(xiàng)目現(xiàn)場(chǎng),看到天眼采用的濾波材料突然有了靈感。工程師開始嘗試引入一種濾波材料,通過對(duì)氣流進(jìn)行導(dǎo)流,讓隨性的風(fēng)走直線,破解湍流造成的硬盤性能影響。
PS:H.Tennekes&J.L. Lumley 曾對(duì)湍流進(jìn)行過評(píng)論:嘗試解決湍流問題的成功與否,強(qiáng)烈地取決于包括做出關(guān)鍵性假設(shè)的靈感。 湍流需要奔放的發(fā)明者,正如需要專業(yè)分析師那么重要。
這一濾波材料的形狀要如何確定呢?工程師們嘗試了多種不同的形狀,效果都不理想。在一次偶然的出差中,深圳機(jī)場(chǎng)六邊形的蜂窩結(jié)構(gòu)的設(shè)計(jì)又給工程師帶來了靈感,六邊形蜂窩狀結(jié)構(gòu),省材料,夠堅(jiān)固,通風(fēng)量也最好,工程師們將其引入M6服務(wù)器設(shè)計(jì),進(jìn)行仿真測(cè)試,設(shè)計(jì)出了波導(dǎo)網(wǎng)——鋁制六邊形蜂巢網(wǎng),它能夠破解湍流,引導(dǎo)風(fēng)流直吹,同時(shí)在厚度上不足0.2mm,確保了進(jìn)風(fēng)處的最大通風(fēng)量,重量也僅11克左右。
增加波導(dǎo)網(wǎng)進(jìn)行導(dǎo)流,內(nèi)部氣流更加流暢
增加波導(dǎo)網(wǎng)進(jìn)行導(dǎo)流,內(nèi)部氣流更加流暢
這一結(jié)構(gòu)可以將不規(guī)則的湍流切割成平穩(wěn)的層流。經(jīng)過高頻度仿真測(cè)試協(xié)同,浪潮信息工程師為M6旗下每一款服務(wù)器的波導(dǎo)網(wǎng)蜂巢單元尺寸進(jìn)行了科學(xué)匹配,定制出最佳孔徑、厚度大小的波導(dǎo)網(wǎng)。與此同時(shí),工程師還借鑒了"音樂廳"降低噪聲的方法,在波導(dǎo)網(wǎng)周圍貼附上吸音海綿,進(jìn)一步降低噪音對(duì)硬盤和機(jī)箱共振的干擾。
波導(dǎo)網(wǎng),一個(gè)小的改變,化解了硬盤極限壓力危機(jī),然而,收獲并未就此停止,數(shù)據(jù)顯示,通過采用波導(dǎo)網(wǎng),M6服務(wù)器的硬盤性能提升:6%-8%;服務(wù)器散熱效率提升:17%-22%;數(shù)據(jù)中心可節(jié)約能耗:6%-8%。
相對(duì)于計(jì)算技術(shù)的創(chuàng)新而言,波導(dǎo)網(wǎng)可能只能算是微創(chuàng)新,但往往細(xì)節(jié)決定成敗,微小的進(jìn)步的累積,會(huì)引導(dǎo)風(fēng)向,也會(huì)引動(dòng)風(fēng)潮。