北京2022年6月9日 /美通社/ --
狹小,不到0.002立方米空間內(nèi);
氣流,被每秒500轉的風扇擾動;
瞬間,所有電氣組件變?yōu)槟μ齑髽牵?br />極限,硬盤數(shù)據(jù)接近滿載;
此時,硬盤讀寫頭以10納米的距離,懸浮于盤片之上……
硬盤正在經(jīng)歷一項極致嚴苛的性能與可靠性測試——服務器工作環(huán)境溫度已經(jīng)超過數(shù)據(jù)中心環(huán)境溫度標準,與此同時內(nèi)部一臺散熱風扇停止工作,要求服務器仍然能正常運轉,硬盤的讀寫性能依舊在線,以保障在這類極小概率出現(xiàn)的業(yè)務場景中硬盤數(shù)據(jù)的安全,性能的穩(wěn)定。但在極限測試中,浪潮信息工程師發(fā)現(xiàn),在對于硬盤進行接近滿載的高負荷壓力測試時,硬盤的穩(wěn)定性猶如在亂風中飛舞的柳絮飄忽不定,甚至還出現(xiàn)了徹底報廢的極端故障。
面對數(shù)據(jù)中心數(shù)據(jù)計算量的幾何級增長,這種看似在罕見場景、極限測試才出現(xiàn)的故障問題,也不能輕易忽視,必須要找到"神隱"背后的問題根源。
尋找毫厘之間的玄謎!一個好消息、一個壞消息?
為了揭開硬盤讀寫性能下降的謎題,浪潮信息工程師首先針對服務器的關鍵組件進行逐一篩查,替換了不同的風扇、硬盤、內(nèi)部主板以及背部連接器等進行對比分析,但問題依然存在。工程師又結合定量分析,改變環(huán)境溫度、調節(jié)風扇轉速等等進行了大量的實驗測試,終于發(fā)現(xiàn)每當風扇轉速達3萬轉/分鐘,服務器的硬盤讀寫性能就開始下降。
基于這一發(fā)現(xiàn),結構仿真、流體仿真等多個團隊協(xié)同合作,找到了問題的答案——當散熱風扇轉速達到3萬轉的極限轉速時,系統(tǒng)風扇進風端形成的湍流,即氣流漩渦,會存在于硬盤和風扇之間的空間,而硬盤是精密度很高的部件,對湍流信號感知非常敏感,不規(guī)則的湍流可能會給硬盤性能帶來巨大的影響。輕則影響硬盤磁頭讀寫性能下降,嚴重則會硬盤報廢,導致數(shù)據(jù)丟失。
引起"湍流"的散熱風扇是保障服務器計算性能和散熱的核心部件之一,但極限轉速的風扇所產(chǎn)生的"湍流"又會影響硬盤的性能和可靠性,浪潮信息工程師需要尋找性能與散熱極致平衡的方法,讓計算性能、散熱、可靠性達到和諧統(tǒng)一。
問題雖然得已鎖定,但工程師們欣喜之下,又不得不去面對一個壞消息——能否有效治理"湍流"是數(shù)學屆的千禧年7大難題之一。浪潮信息工程師要做的就是尋找破解風扇高速轉動而產(chǎn)生湍流效應的方法。
破解"湍流" 意外破"圈"帶來驚喜
想要有效的破解"湍流",就意味著要讓雜亂的"湍流"變成平穩(wěn)的"層流"。在項目組百思不得其解的時候,浪潮信息工程師在參與FAST天眼項目現(xiàn)場,看到天眼采用的濾波材料突然有了靈感。工程師開始嘗試引入一種濾波材料,通過對氣流進行導流,讓隨性的風走直線,破解湍流造成的硬盤性能影響。
PS:H.Tennekes&J.L. Lumley 曾對湍流進行過評論:嘗試解決湍流問題的成功與否,強烈地取決于包括做出關鍵性假設的靈感。 湍流需要奔放的發(fā)明者,正如需要專業(yè)分析師那么重要。
這一濾波材料的形狀要如何確定呢?工程師們嘗試了多種不同的形狀,效果都不理想。在一次偶然的出差中,深圳機場六邊形的蜂窩結構的設計又給工程師帶來了靈感,六邊形蜂窩狀結構,省材料,夠堅固,通風量也最好,工程師們將其引入M6服務器設計,進行仿真測試,設計出了波導網(wǎng)——鋁制六邊形蜂巢網(wǎng),它能夠破解湍流,引導風流直吹,同時在厚度上不足0.2mm,確保了進風處的最大通風量,重量也僅11克左右。
這一結構可以將不規(guī)則的湍流切割成平穩(wěn)的層流。經(jīng)過高頻度仿真測試協(xié)同,浪潮信息工程師為M6旗下每一款服務器的波導網(wǎng)蜂巢單元尺寸進行了科學匹配,定制出最佳孔徑、厚度大小的波導網(wǎng)。與此同時,工程師還借鑒了"音樂廳"降低噪聲的方法,在波導網(wǎng)周圍貼附上吸音海綿,進一步降低噪音對硬盤和機箱共振的干擾。
波導網(wǎng),一個小的改變,化解了硬盤極限壓力危機,然而,收獲并未就此停止,數(shù)據(jù)顯示,通過采用波導網(wǎng),M6服務器的硬盤性能提升:6%-8%;服務器散熱效率提升:17%-22%;數(shù)據(jù)中心可節(jié)約能耗:6%-8%。
相對于計算技術的創(chuàng)新而言,波導網(wǎng)可能只能算是微創(chuàng)新,但往往細節(jié)決定成敗,微小的進步的累積,會引導風向,也會引動風潮。