北京2022年6月14日 /美通社/ -- 近日,專業(yè)媒體"架構師技術聯(lián)盟"發(fā)布了基于浪潮GPU服務器NF5468A5的性能測評報告。報告顯示,NF5468A5搭載2顆AMD Milan-X 7773X運行常見的氣象應用WRF和計算流體力學應用OpenFOAM作為性能基準測試,其性能相比搭載兩顆Rome 7742時的計算性能提升可高達80%。
NF5468A5是一款4U支持2顆AMD EPYC處理器和8顆雙寬GPU卡,面向AI訓練、推理、視頻編解碼等多種應用場景的GPU服務器。此次測試采用分別搭載2顆AMD Milan-X 7773X、Milan 7543和Rome 7742的配置組合。
AMD Milan-X處理器最大的亮點,就是采用3D堆疊技術(3D V-Cache),在不改變處理器面積的前提下,可用L3 緩存(SRAM)總數(shù)增加三倍。做個形象的比喻,這種3D堆疊技術就像將把相同面積的平房升級成三層小樓,通過縱向空間成倍擴展緩存數(shù)量。評測采用的NF5468A5平臺是浪潮信息暢銷海內外的彈性云AI服務器NF5468系列的全新產品,率先支持PCIe 4.0技術,4U空間內可裝載2顆采用7nm先進制程工藝的AMD EPYC處理器和8塊PCIe Gen4接口的AI加速卡,能夠最大限度的發(fā)揮Milan-X處理器的極致性能。
WRF(The Weather Research and Forecasting Model),即天氣預報模式,被譽為是次世代的中尺度天氣預報模式,往往用于大范圍高分辨的氣候模擬,對系統(tǒng)的運算性能、內存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是對連續(xù)介質力學問題進行數(shù)值計算的軟件,經常應用于汽車仿真等行業(yè),進行仿真計算需要處理大量的實時數(shù)據(jù),所以對系統(tǒng)的計算能力、數(shù)據(jù)吞吐能力都有很高的要求。
基于浪潮NF5468A5評測報告顯示,Milan-X處理器通過搭載3D堆疊技術獲得更高的L3緩存,確實對計算性能有較大提升,而性能改進意味著企業(yè)可以在更少的服務器上運行相同的作業(yè),消耗的功率也能有明顯降低。如下是評測報告中的性能測試數(shù)據(jù):
在WRF測試中,使用單節(jié)點相同核心數(shù),以Rome 7742處理器運行時間為基準,在Milan 7543上的計算性能提升14%~27%,而在Milan-X 7773X處理器上性能提升 23%~34%。
在OpenFOAM基準算例motorBike測試中,使用不可壓穩(wěn)態(tài)求解器simpleFoam計算模擬摩托車和騎手周圍空氣的運動情況。同樣以Rome 7742處理器為基準,OpenFOAM在Milan 7543處理器使用單節(jié)點相同核心測試性能提升23%~28%,在Milan-X 7773X處理器上性能提升34%~80%。
在本次評測中也對NF5468A5有比較細致的介紹,據(jù)浪潮官網顯示NF5468A5正在推出"超值機型 限免試用",對該GPU服務器感興趣的不妨一試。如下是評測中對于浪潮NF5468A5的介紹:
NF5468A5采用分區(qū)散熱設計,內置獨立的CPU和GPU主板,且分別安裝在不同的平面。從機箱內部結構來看,設計者將發(fā)熱量高的的GPU放在了機箱上3U空間,CPU板處于機箱下1U,內置6對12個6056風扇模組配合導風罩,實現(xiàn)機箱內風道分流,正是基于這種獨特分層散熱設計,使得送測的NF5468A5服務器可以支持280W最高功耗的Milan-X 7773X。系統(tǒng)設計支持32條DDR4 ECC內存,支持LRDIMM/RDIMM,提供高達8T的本地內存,實現(xiàn)與1536 MB 超大L3 cache間的高速數(shù)據(jù)交互。
NF5468A5采用了CPU直連GPU架構設計,率先支持PCI-E 4.0技術,最大限度提升CPU與GPU間的帶寬,降低通信延遲,達到最佳效能,為客戶提供極致優(yōu)化的算力。系統(tǒng)提供豐富的IO擴展能力,提供10個PCIe 4.0 X16擴展槽位,支持8個全高全長的GPU加速卡。提供靈活存儲方案,可選前置12 × 3.5英寸硬盤或24 × 2.5英寸硬盤,提供超大的本地存儲能力,同時最大可支持8個熱插拔NVMe SSD全閃配置,提供存儲到內存到L3 cache的高速訪存,可實現(xiàn)十倍于高端企業(yè)級SATA SSD的IOPS性能,帶來極致IO存儲性能飛躍。