北京2022年8月16日 /美通社/ -- "一只南美洲亞馬遜河流域熱帶雨林中的蝴蝶,偶爾扇動幾下翅膀,可以在兩周以后引起美國得克薩斯州的一場龍卷風(fēng)。" -- 這便是著名的"蝴蝶效應(yīng)"。這種現(xiàn)象不僅出現(xiàn)于自然界,在生活中、產(chǎn)品設(shè)計中都能得到驗證,對服務(wù)器行業(yè)來說也不例外。作為一種高精密度的產(chǎn)品,服務(wù)器中每個的部件都是一只"蝴蝶",其中硬盤是服務(wù)器最重要的存儲單元,不僅要讓數(shù)據(jù)存的下,還要不斷突破讀寫性能瓶頸,以在不同場景中,讓服務(wù)器的計算能力和存儲能力得以最優(yōu)呈現(xiàn)。
服務(wù)器硬盤讀寫性能提升的 "三大難關(guān)"
基于大量的研發(fā)測試數(shù)據(jù),浪潮信息服務(wù)器研發(fā)團(tuán)隊在研發(fā)過程中歸納了服務(wù)器中硬盤讀寫性能提升面臨的三大挑戰(zhàn):
第一,大容量機(jī)械硬盤對振動和噪聲天生敏感。隨著硬盤容量的持續(xù)攀升,磁道寬度已經(jīng)達(dá)到納米級別,硬盤的磁臂需要精確控制讀寫磁頭懸停在磁道中心,而外部的振動和噪聲干擾都會引起內(nèi)部機(jī)械部件的共振,使磁頭位置發(fā)生偏移,導(dǎo)致其無法正常讀寫。因此大容量機(jī)械硬盤對振動和噪聲格外敏感;
其次,內(nèi)部原生的振動和噪音。服務(wù)器系統(tǒng)功耗持續(xù)攀升帶來的散熱壓力劇增,風(fēng)扇轉(zhuǎn)速快速拉升,帶來更強(qiáng)勁風(fēng)量的同時也產(chǎn)生了更高的振動及噪音,系統(tǒng)風(fēng)扇噪聲影響是造成硬盤讀寫性能下降(以下簡稱PLV)的關(guān)鍵因素。硬盤的磁頭就像一輛跑車在非常狹窄的道路上飛馳,但是道路還在劇烈的晃動,這就很難保持在道路的中心行駛。
第三,服務(wù)器機(jī)箱與硬盤的兼容性問題。由于機(jī)箱和硬盤的設(shè)計開發(fā)是互相獨立的過程,二者之間由振動引起的兼容性問題需要服務(wù)器系統(tǒng)實機(jī)試驗后才能發(fā)現(xiàn),而問題出現(xiàn)后往往難以補(bǔ)救。
自研測試分析平臺 為性能優(yōu)化提供精準(zhǔn)數(shù)據(jù)
為定位設(shè)計問題,破解性能提升的研發(fā)技術(shù)難題,浪潮信息服務(wù)器研發(fā)團(tuán)隊針對PLV問題"黑盒子"的解析方法,開發(fā)出一套硬件與軟件結(jié)合的測量分析系統(tǒng),并設(shè)計了嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)模型及算法。
研發(fā)團(tuán)隊第一時間與國際一流的硬盤廠商合作并建立了聯(lián)合實驗室,設(shè)計了一種硬盤單體的分頻段噪音掃頻測試方法,再將大量實測數(shù)據(jù)抽象為一個統(tǒng)一的敏感度數(shù)學(xué)模型,精確定位到每種硬盤可兼容的噪音臨界頻譜,為PLV問題的根因診斷提供了第一手?jǐn)?shù)值依據(jù)。
當(dāng)前浪潮信息的測試數(shù)據(jù)庫已覆蓋市場上所有主流硬盤,滿足主流服務(wù)器產(chǎn)品需求的同時在面對客戶定制化需求,也能大大縮短了研發(fā)周期,保障新品的敏捷響應(yīng)速度。
在明確硬盤單體特性后,浪潮信息研發(fā)團(tuán)隊針對服務(wù)器產(chǎn)品制定出一套噪音振動信號的數(shù)據(jù)采集分析系統(tǒng),形成噪音振動量化平臺,配合專門設(shè)計的"硬盤假體"采集服務(wù)器機(jī)箱內(nèi)的噪音與振動。研究發(fā)現(xiàn),噪音PSD譜與硬盤噪音敏感度模型的定量匹配效果非常準(zhǔn)確,盡管機(jī)箱內(nèi)的噪音頻率成分非常復(fù)雜,但通過機(jī)理性研究和大量測試數(shù)據(jù)分析發(fā)現(xiàn),找到了硬盤噪音敏感度與超限聲壓強(qiáng)度的線性回歸模型,通過浪潮專利算法模型可以準(zhǔn)確計算出硬盤內(nèi)部的共振頻率,以及這些共振導(dǎo)致的性能損失率,至此,PLV問題的"黑盒子"已開啟,硬盤的性能損失率在頻率域展開后,可以明確識別到影響硬盤性能的噪音頻率成分。
經(jīng)過噪音頻譜診斷之后,便到了最關(guān)鍵的環(huán)節(jié),如何將研發(fā)成果轉(zhuǎn)化為產(chǎn)品應(yīng)用,并最終為客戶帶來收益,這才是浪潮信息研發(fā)工程師的"初心"。"從小見大"浪潮信息工程師開啟了服務(wù)器內(nèi)部優(yōu)化的探索,首先是服務(wù)器中"噪音和振動"的源頭 -- 風(fēng)扇,研發(fā)工程師發(fā)現(xiàn)扇葉的3D形態(tài)、氣體的流速都會從根本上影響噪音的頻率成分,所以要降低振動就要從風(fēng)扇本身先著手,通過上百次的選型測驗,浪潮信息M6系列服務(wù)器采用改進(jìn)選型后的風(fēng)扇,硬盤性能達(dá)到17%的提升。
突破源頭本身后,第二步便是運用設(shè)計優(yōu)化,進(jìn)一步提高性能。針對于固有架構(gòu)的通用服務(wù)器產(chǎn)品,因受到空間限制,除了通過風(fēng)扇選型解決的振動難題,浪潮研發(fā)團(tuán)隊再次通過不斷探索實踐找到了一條新路子,將機(jī)箱內(nèi)安裝的吸音材料特性發(fā)揮到極致。
不同的材質(zhì)、不同的形態(tài)、不同的安裝位置、不同的截面都會有不同的效果,尺寸、材料、位置均影響插入損失,每一種設(shè)計都有其獨特的頻率屬性。浪潮信息工程師在頻率域內(nèi)定位出引發(fā)硬盤共振的噪音成分后,從3000多種設(shè)計中篩選出插入損失最匹配的吸音棉樣本,精準(zhǔn)調(diào)整噪音頻譜,猶如雕刻師一般對聲音精雕細(xì)琢。如此精準(zhǔn)的設(shè)計在保障成本的同時使噪音的能量降低了一半以上(降低4dB),硬盤的IOPS性能提高了50%,有效應(yīng)對小文件隨機(jī)讀寫頻繁的應(yīng)用場景。
同時,浪潮信息工程師也在從整體布局上考量如何減振降噪。以往業(yè)內(nèi)的通用服務(wù)器內(nèi)部風(fēng)扇緊隨硬盤,但硬盤自身的振動和風(fēng)扇轉(zhuǎn)速提高帶來的振動,對硬盤的損傷極大,導(dǎo)致故障發(fā)生,兩者疊加帶來的影響更是明顯。如果將風(fēng)扇遠(yuǎn)離硬盤,對系統(tǒng)會有什么影響?
浪潮M6系列整機(jī)柜服務(wù)器就采用了這樣的結(jié)構(gòu),將風(fēng)扇移至機(jī)柜的最后部,拉遠(yuǎn)與硬盤的距離,而和機(jī)柜柜體形成了一個整體。相比風(fēng)扇,機(jī)柜的體量巨大,兩者的振動疊加實際上起到了"削峰填谷"的功效。此振動再傳到硬盤之時,就已經(jīng)有了大幅降低。如此設(shè)計的效果明顯,相比傳統(tǒng)的服務(wù)器結(jié)構(gòu),硬盤故障率下降了將近一個數(shù)量級。
就像所說的"蝴蝶效應(yīng)"一樣,浪潮服務(wù)器產(chǎn)品的每一處的細(xì)節(jié)都在追求突破和創(chuàng)新,比如:在硬件層面,浪潮M6服務(wù)器通過動態(tài)Power Capping技術(shù),過載實時響應(yīng)措施確保系統(tǒng)供電安全;固件層面,浪潮M6服務(wù)器依靠ROM芯片冗余技術(shù)可為BIOS、BMC等固件提供"雙芯雙待"鏡像備份的底層安全保護(hù),采用FPGA作為平臺信任根,可實時監(jiān)控度量服務(wù)器整機(jī)底層安全性,全方位保障固件安全可靠;系統(tǒng)層面,M6服務(wù)器以零故障、免宕機(jī)和無風(fēng)險為目標(biāo)制定系統(tǒng)安全可靠設(shè)計策略等等。
研發(fā)的工作是反復(fù)而精細(xì)的,但浪潮信息的研發(fā)團(tuán)隊一直秉承著精益、極致的設(shè)計理念,讓浪潮信息打造了服務(wù)器的爆品,創(chuàng)新的設(shè)計,優(yōu)異的性能,設(shè)計指導(dǎo)生產(chǎn),生產(chǎn)滿足設(shè)計。
浪潮信息,開放計算踐行者
浪潮信息研發(fā)團(tuán)隊的研究成果讓客戶在使用浪潮服務(wù)器時得到了良好的收益,而浪潮信息作為全球的服務(wù)器領(lǐng)先廠商和開放計算的踐行者,已作為主要廠商參與到了OCP-Storage-HDD Dynamics 工作組進(jìn)行技術(shù)研討。該工作組由來自全球的存儲和服務(wù)器頭部廠商組成,從2020年開始發(fā)起關(guān)于"如何實現(xiàn)硬盤與服務(wù)器機(jī)箱長久持續(xù)的兼容性"的討論,浪潮信息基于自有的研究成果和設(shè)計經(jīng)驗,積極參與其中,制定國際行業(yè)標(biāo)準(zhǔn),為行業(yè)的發(fā)展不遺余力。
目前該工作組已聯(lián)合發(fā)布了硬盤振動噪音量化測試白皮書,實現(xiàn)技術(shù)語言與測量工具的標(biāo)準(zhǔn)化,為產(chǎn)業(yè)上下游各類伙伴交流提供便捷。