北京2022年1月12日 /美通社/ -- 一臺服務器,要經(jīng)歷多少打磨與雕琢,方能抵達客戶?因果相承,已是全球第二、中國市場第一的浪潮服務器,耀眼成績的背后有著怎樣的努力和堅持?高品質的代名詞,何以得來?滿足客戶需求,一句說易行難的行業(yè)口頭禪,要如何做到的?
浪潮信息邊緣計算產品總設計師孫波,將為大家講述關于服務器誕生的歷程:
視頻:https://haokan.baidu.com/v?pd=bjh_app&vid=5706178650990524594
小風扇,大學問
隨著業(yè)務負載的激增,服務器計算、存儲的性能也在不斷提升,CPU、GPU等部件功耗快速攀升,比如CPU最大功耗從原來的150瓦提升到200瓦、250瓦甚至300瓦,服務器內部熱量疏導面臨巨大挑戰(zhàn),散熱風扇的轉速從每分鐘1萬轉提升到2萬轉,甚至達到3萬轉。但對于高精密度的服務器來說,看似簡單的風扇轉速提升可能會產生一系列復雜影響,就像氣象學家提出的“蝴蝶效應” -- 亞馬遜流域的一只蝴蝶扇動翅膀,可能會掀起密西西比河流域的一場風暴。
因此,散熱仿真成為服務器設計中很重要的一環(huán),他決定著在不同業(yè)務負載中,如何為整個系統(tǒng)提供最合適的溫度環(huán)境,以保證計算、存儲發(fā)揮最佳實力。但就在日常的散熱仿真中,工程師發(fā)現(xiàn)風扇隨著轉速提升,吹出來的風流實際上會有湍流效應,也就是說風并非平穩(wěn)的沿著直線流動,而是旋轉著往前走,數(shù)個風扇之間的風流就會“打架”、產生“亂流”,造成內部氣流、部件的振動。如何解決該問題呢?
這需要機箱結構方面,對風扇進風口的風流、風道,進行約束、整流。浪潮信息在其新一代產品M6系列服務器之上,新增“波導網(wǎng)”設計 -- 當風流通過這個六邊形蜂窩狀波導網(wǎng)時,旋轉的湍流被切割成平流,為整個空間提供平行穩(wěn)定且強勁的氣流。
這一巧思收益顯著,不僅大幅降低因為空氣擾動帶來的振動,還提升了17%~22%散熱效率。
另外還有一些設計,比如將硬盤懸浮使其與機箱軟連接,緩沖、吸收振動,以及加裝吸音棉來減少振動及噪音。
服務器,是一類成熟已久的產品形態(tài),其架構、組件、搭配、布局等諸多環(huán)節(jié)經(jīng)過幾十年的發(fā)展,業(yè)已定型。可供研發(fā)人員施展的空間,更多的是在細節(jié) -- 基于“大處著眼、小處著手”,浪潮信息工程師從細節(jié)入手,發(fā)揮創(chuàng)新及工匠精神,力求做到精益求精。
大機柜,大動作
風扇緊隨硬盤,是業(yè)內通行的做法。硬盤自身的振動和風扇轉速提高帶來的振動,對硬盤的損傷極大,導致故障發(fā)生,兩者疊加帶來的影響更是明顯。
如果將風扇移至到服務器機柜的后端呢?浪潮整機柜服務器就采用了這樣的結構,將風扇移至機柜的最后部,拉遠與硬盤的距離,而和機柜柜體形成了一個整體。相比風扇,機柜的體量巨大,兩者的振動疊加實際上起到了“削峰填谷”的功效。此振動再傳到硬盤之時,就已經(jīng)有了大幅降低。
“如此設計的效果明顯,相比傳統(tǒng)的服務器結構,硬盤故障率下降了將近一個數(shù)量級?!?/p>
事實上,這樣的設計并非是簡單的移位而已,既定的服務器電源、硬盤、存儲等內部結構需要重新規(guī)劃,其間的組件需要重新布局,是牽一發(fā)而動全身的大動作。
不僅僅是產品設計的“大動作”,全新結構的整機柜服務器還要考慮如何保障運輸過程中不受道路顛簸的振動影響。因此測試工程師在貨車輪軸、車體、服務器機柜柜體及節(jié)點、硬盤、內存,以及機柜的木托,幾乎所有會受到振動的位置都安裝傳感器,驅車從濟南出發(fā)到杭州千島湖,又北上一直到內蒙古,全程奔襲約三千公里,為的就是抓取沿途所有的振動信息,形成基于路譜的振動測試數(shù)據(jù)樣本,以此路譜測試而形成服務器機柜測試的標準和規(guī)范。
同時,此標準和規(guī)范還要更嚴格于路譜測試中取得的數(shù)值,從而保證機柜成品在運輸及交付過程中萬無一失。
盡管如上文所言,服務器這種成熟型產品給予研發(fā)的施展空間有限,但浪潮信息似乎未曾受此制約,敢讓舊貌換新顏,其創(chuàng)造力顛覆了業(yè)界規(guī)則,重新定義了IDC,將整機柜作為大規(guī)模數(shù)據(jù)中心部署的“積木”。如今,不斷升級的整機柜形態(tài)的服務器成為近50%的大規(guī)模數(shù)據(jù)中心的主流形態(tài)。
從數(shù)據(jù)中心到邊緣,服務器開始防水、防塵、耐高溫
相比通用服務器,邊緣計算對服務器的要求更高。其部署場景從“條件優(yōu)越”的數(shù)據(jù)中心遷移至沙漠戈壁、江河湖海、東北油田等“極端惡劣”的場景要承受風沙、雨水、酷熱、嚴寒等多重考驗。
比如在戶外場景中,服務器難免會遇到雨水淋浸,如果密封性不達標,雨水通過縫隙滲到電子元器件或者PCB板上,極易引起元器件短路甚至設備報廢。針對這樣的使用環(huán)境,工程師要進行防水防塵實驗,并優(yōu)化服務器內部散熱結構,以保障無論是高溫、暴雨還是風沙、極寒的惡劣戶外環(huán)境中依然可以穩(wěn)定運行。
比如路邊的信號控制箱,由于箱體內沒有散熱裝置,一些簡單的通風孔因避免雨水進入而將出口設置為朝下,熱氣流很難排出,所以當外界溫度達到40攝氏度時,箱體內部會遠遠高于這一數(shù)字——相應的,浪潮邊緣服務器要求支持到65攝氏度甚至70攝氏度的高溫。
無空想不臆斷,一切結論來源于實踐,取自于真實需求。
品質的守門員
以上案例,只是在“浪潮澎湃實驗室”進行過的幾個小片段,窺斑見豹,這樣的場景在此地時時上演、發(fā)生著。
在澎湃實驗室里,擁有包括氣候環(huán)境、機械環(huán)境、結構散熱、電磁兼容、系統(tǒng)驗證、精密測量、失效分析和數(shù)據(jù)中心等實驗室,涵蓋服務器創(chuàng)新技術預研、產品部件驗證、新品定型、出廠質量檢測等一系列測試環(huán)節(jié)。
同時,其間的每一項測試,都有著細致的流程及管控措施。
浪潮每年研發(fā)兩三百款產品,據(jù)統(tǒng)計,每一款產品在出廠前都會經(jīng)過超2000次的測試,涵蓋30余種極限測試 -- 毫無疑問,“浪潮澎湃實驗室”嚴苛的研發(fā)標準和測試機制,保障著服務器產品的高品質。
高標準嚴要求
值得特別指出的是,針對一些具有國標的產品線,需要在國標基礎上再額外提高標準。例如通用服務器,其國標要求是在35攝氏度高溫下持續(xù)運行兩小時,而在澎湃實驗室里會將此標準做進一步的細化和加嚴測試 -- 在高溫高濕和高溫低濕環(huán)境下將溫度上提至40攝氏度,持續(xù)運行16小時甚至24小時。
而針對一些暫時沒有國標或者新產品,需要積極摸索、提煉其測試標準,這個從零到一的過程,實際上更多源于經(jīng)驗和測試手段總結而來。前文提到的,邊緣服務器支持65攝氏度甚至70攝氏度高溫,即是一例證。
無論有無國標,工程師都會按照業(yè)界實際使用的環(huán)境、應用場景來不斷打磨其產品,并提高標準,即“高標準嚴要求”。
在遵循并超越標準的同時,浪潮信息還積極參與制定標準。
截至目前,浪潮信息牽頭和參與標準制修訂99項,其中國際標準8項,國行標79項;在服務器領域,牽頭和參與標準制修訂11項,其中國際標準1項,國行標8項;牽頭制修訂的5項服務器國家標準已發(fā)布,其中GB/T 39680-2020《信息安全技術—服務器安全技術要求和測評準則》,適用于服務器的研制、生產、維護和測評。
圍繞著服務器做足文章,浪潮對此不遺余力。
聯(lián)合定制開發(fā)
不僅如此,浪潮首創(chuàng)的JDM(Joint Design Manufacture,聯(lián)合設計開發(fā)制造)模式,也正在凸顯出驚人的爆發(fā)力。
而今,客戶需求的差異化愈加明顯,需要服務器產品在品類、功能和配置等更加豐富、多樣。特別是邊緣服務器,面對的應用場景千差萬別,連接的設備五花八門,都極具“個性”。
如何做到模塊化設計,將個性需求“產品化”?在保證高品質的前提下,如何進行快速迭代、縮短交付周期?如何將計算、AI、網(wǎng)絡處理、接口等功能單元獨立出來,并可以靈活地按需組合?……
JDM就是浪潮正在推行并取得顯著成效的“方法論” -- 從其具備的五項要素及特點,就可看出這一模式具有的優(yōu)越性,即共同挖掘需求、協(xié)同研發(fā)、產品管控、供應鏈對接、全球交付與服務。
歸結到底,JDM模式即是“聯(lián)合定制開發(fā)”的理念:從產品立項研發(fā)之時,客戶就深度參與,雙方緊抓實際需求予以產品定制,并將定制這一核心理念貫穿于產品全生命周期。
近幾年,浪潮先后與阿里、百度、騰訊、京東、網(wǎng)易等客戶進行了JDM合作,在AI、邊緣、云計算領域聯(lián)合創(chuàng)新。
系出“澎湃”
研發(fā)及測試工作,從來都不是腦洞大開、靈感乍現(xiàn)、一蹴而就,而是無數(shù)的測試、紛繁的數(shù)據(jù)、反復地打磨、辛勤的日與夜……也唯有“精益求精”一詞來描述。
自1993年推出首款服務器,近30年心無旁騖,積跬步致千里,浪潮信息的成功實屬必然,奪得全球第二即是市場對其授予的軍功章 -- 之上,亦有“澎湃”之名……