北京2023年9月15日 /美通社/ -- 精益求精的設(shè)計(jì)理念最早起源于建筑學(xué),它要求設(shè)計(jì)師在建筑結(jié)構(gòu)荷載上充分考慮極限設(shè)計(jì)下的結(jié)構(gòu)功能,強(qiáng)調(diào)建筑結(jié)構(gòu)需滿足安全性、可靠性、耐久性。如今,這種設(shè)計(jì)理念也融匯到各行各業(yè),其中科技行業(yè)更是典型代表,服務(wù)器產(chǎn)品的設(shè)計(jì)更不例外。
對(duì)于服務(wù)器來(lái)說(shuō),可以從三個(gè)方面來(lái)看:首先,在產(chǎn)品設(shè)計(jì)時(shí),結(jié)合不同的應(yīng)用場(chǎng)景設(shè)計(jì)不同形態(tài)的產(chǎn)品來(lái)滿足業(yè)務(wù)需求;其次,在部件選型上,要考慮如何發(fā)揮性能和品質(zhì)保障;最后,對(duì)產(chǎn)品結(jié)構(gòu)、部件進(jìn)行優(yōu)化,在滿足期望性能的前提下,加強(qiáng)產(chǎn)品的易用性和可靠性。
浪潮信息今年發(fā)布的全新G7算力平臺(tái),正是秉承了精益求精的設(shè)計(jì)理念,采用最先進(jìn)的計(jì)算、存儲(chǔ)和互聯(lián)技術(shù),實(shí)現(xiàn)全場(chǎng)景覆蓋,提供了從器件、整機(jī)到數(shù)據(jù)中心的全尺度智能化管理。
更佳性能 源自以系統(tǒng)為核心
建筑大師張開濟(jì)曾說(shuō)過(guò):"建筑設(shè)計(jì)不能只顧自己的一個(gè)設(shè)計(jì),而要和整個(gè)城市的風(fēng)格相和諧"。以整體為核心的設(shè)計(jì),才是筑基經(jīng)典的開始…而服務(wù)器作為數(shù)據(jù)中心中承載著數(shù)據(jù)處理的算力平臺(tái),需要以全局視角來(lái)進(jìn)行產(chǎn)品設(shè)計(jì)才是發(fā)揮出極限性能,包括解決架構(gòu)設(shè)計(jì)、核心部件、高速互聯(lián)、散熱設(shè)計(jì)等一系列問(wèn)題。
浪潮信息G7算力平臺(tái)堅(jiān)持以系統(tǒng)為核心,從電路級(jí)、部件級(jí)、固件級(jí)、系統(tǒng)級(jí)進(jìn)行了大量的創(chuàng)新工作。以一臺(tái)通用服務(wù)器的研發(fā)為例,整個(gè)系統(tǒng)需要經(jīng)過(guò)30多個(gè)開發(fā)流程,使用150多種加工制造工藝,對(duì)280多個(gè)關(guān)鍵過(guò)程控制點(diǎn)的質(zhì)量進(jìn)行嚴(yán)格把控,并且還要實(shí)現(xiàn)與軟件和應(yīng)用的優(yōu)化和適配等問(wèn)題。
系統(tǒng)設(shè)計(jì)的開端是保障供電,G7算力平臺(tái)擁有極限供電能力,采用第三代半導(dǎo)體碳化硅及氮化鎵開關(guān)元件,電源功率密度提升至100W/in³,在占比最高的20%~50%電源負(fù)載時(shí),自動(dòng)識(shí)別調(diào)適轉(zhuǎn)化率可達(dá)94%,提升4%~6%的轉(zhuǎn)換效率。
擁有強(qiáng)大動(dòng)源后,影響產(chǎn)品性能的關(guān)鍵因素是整機(jī)散熱能力,G7算力平臺(tái)提供多種散熱方案,傳統(tǒng)風(fēng)冷模式從風(fēng)扇結(jié)構(gòu)、熱流導(dǎo)風(fēng)技術(shù)、智能風(fēng)扇調(diào)控技術(shù)、EVAC散熱技術(shù)、整機(jī)架構(gòu)等進(jìn)行優(yōu)化,通過(guò)復(fù)合型散熱調(diào)控,破解風(fēng)源、風(fēng)流場(chǎng)和高功耗部件難題,整機(jī)散熱效率提升24%以上,單臺(tái)設(shè)備一年可以節(jié)電近千度。面對(duì)PUE更嚴(yán)苛的需求,G7算力平臺(tái)支持冷板式液冷、浸沒式液冷等創(chuàng)新技術(shù),其中冷板式液冷覆蓋包括CPU、內(nèi)存等高功耗部件,液冷覆蓋部件的功耗占比70%以上,可幫助數(shù)據(jù)中心的PUE下降到1.1以下。
在內(nèi)存優(yōu)化方面,G7算力平臺(tái)的存儲(chǔ)模塊E3.S可通過(guò)CXL實(shí)現(xiàn)遠(yuǎn)端內(nèi)存擴(kuò)展,延時(shí)性能基本與跨處理器內(nèi)存訪問(wèn)延時(shí)相當(dāng),滿足云計(jì)算虛擬化場(chǎng)景內(nèi)存擴(kuò)展不足問(wèn)題。在網(wǎng)絡(luò)互聯(lián)方面,G7算力平臺(tái)支持Multi-Host網(wǎng)卡,不僅可以使多個(gè)CPU同時(shí)連接單張網(wǎng)卡,實(shí)現(xiàn)多CPU網(wǎng)絡(luò)IO Balance,減少跨CPU訪問(wèn)延遲,同時(shí)支持多系統(tǒng)之間的互聯(lián),多個(gè)計(jì)算、存儲(chǔ)節(jié)點(diǎn)可以通過(guò)單一的網(wǎng)卡和外界互連,數(shù)據(jù)中心性能可提升150%以上。
正是由于有了以上設(shè)計(jì),G7服務(wù)器在最新的評(píng)測(cè)中摘下SPEC CPU、SPEC jbb雙路、四路性能冠軍,實(shí)現(xiàn)了不同處理器平臺(tái)、不同類型產(chǎn)品性能的全面升級(jí),成為多元計(jì)算力平臺(tái)的性能標(biāo)桿。
場(chǎng)景化設(shè)計(jì) 打造最強(qiáng)產(chǎn)品組合
建筑的本質(zhì)是服務(wù)于功能,歌劇院和寫字樓的應(yīng)用場(chǎng)景不同,呈現(xiàn)的建筑形態(tài)也截然不同,數(shù)據(jù)中心的建設(shè)也是一樣,不同用戶數(shù)據(jù)中心的建設(shè)面對(duì)著不同的挑戰(zhàn),比如機(jī)房空間不足、數(shù)據(jù)量爆炸式增長(zhǎng)、運(yùn)維人員資源不足、擴(kuò)容需求周期緊張等。面對(duì)不同的業(yè)務(wù)場(chǎng)景需求,G7算力平臺(tái)從計(jì)算密度、存儲(chǔ)密度、IO擴(kuò)展等多個(gè)方面進(jìn)行優(yōu)化。
例如,大數(shù)據(jù)技術(shù)的發(fā)展讓數(shù)據(jù)中心用戶開始面對(duì)分布式緩存、熱存儲(chǔ)等差異化的存儲(chǔ)場(chǎng)景,對(duì)服務(wù)器計(jì)算性能、存儲(chǔ)密度以及IO有不同需求。
為此,浪潮信息推出了針對(duì)存儲(chǔ)優(yōu)化型產(chǎn)品——NF5266G7,可應(yīng)對(duì)計(jì)算性能、存儲(chǔ)密度不斷提升,IO擴(kuò)展等多方面的壓力,在2U空間能支持2顆最新處理器,同時(shí)提供最大600TB和上百種存儲(chǔ)配置方案,讓大數(shù)據(jù)應(yīng)用在CPU投資減少50%;而面對(duì)計(jì)算密集型場(chǎng)景, G7算力平臺(tái)可提供2U空間4節(jié)點(diǎn)產(chǎn)品,單機(jī)柜算力可提升4.2倍;而面對(duì)I/O擴(kuò)展需求,G7算力平臺(tái)全系支持雙OCP及Multi-host網(wǎng)卡擴(kuò)展,支持在線熱維護(hù)等,性能提升10%以上。
G7算力平臺(tái)支持8種主流通用處理器芯片,51種加速計(jì)算芯片,打造包括通用計(jì)算、AI計(jì)算、高端計(jì)算、應(yīng)用優(yōu)化、整機(jī)柜、一體機(jī)等產(chǎn)品,并搭載浪潮信息KeyarchOS操作系統(tǒng),實(shí)現(xiàn)了服務(wù)器的軟硬件協(xié)同系統(tǒng)優(yōu)化。
精益求精 穩(wěn)定輸出澎湃算力
建筑設(shè)計(jì)最基本的要求是安全,結(jié)構(gòu)安全性是防止破壞倒塌的能力,是結(jié)構(gòu)工程最重要的質(zhì)量指標(biāo),體現(xiàn)在材料、結(jié)構(gòu)、消防、電氣等建筑的各方面。浪潮信息對(duì)于產(chǎn)品的打造也一直如此,堅(jiān)持將精益求精的設(shè)計(jì)理念融匯到每個(gè)產(chǎn)品,打造高RAS特性。
G7算力平臺(tái)采用 "整機(jī)3層保護(hù)模式",從物理的硬件冗余、系統(tǒng)的降額設(shè)計(jì)及軟件的系統(tǒng)保護(hù)設(shè)計(jì)上層層提升產(chǎn)品可靠性。關(guān)鍵部件的冗余設(shè)計(jì),如CPU供電采用多路供電方式,風(fēng)扇、PSU等部件的N+1冗余設(shè)計(jì),BIOS、BMC的雙ROM設(shè)計(jì)等,在一個(gè)器部件故障后,冗余的器部件可以保障系統(tǒng)作業(yè)不會(huì)中斷。
系統(tǒng)的降額設(shè)計(jì),當(dāng)機(jī)柜供電能力受限或者單個(gè)PSU供電不足時(shí),浪潮信息獨(dú)有的動(dòng)態(tài)Power Capping技術(shù)提供過(guò)載實(shí)時(shí)響應(yīng)措施確保系統(tǒng)供電安全,確保業(yè)務(wù)連續(xù)性,實(shí)現(xiàn)主板MTBF無(wú)故障工作時(shí)間超過(guò)24W小時(shí)。這背后是主板上每一顆電容的嚴(yán)苛選擇,通過(guò)千萬(wàn)次的測(cè)試和仿真實(shí)驗(yàn),優(yōu)化元器件布局和散熱策略,減少元器件壓力及減緩老化,從而延長(zhǎng)產(chǎn)品壽命,避免業(yè)務(wù)場(chǎng)景不同或機(jī)房差異帶來(lái)的系統(tǒng)工作異常問(wèn)題;而軟件的系統(tǒng)保護(hù)是可靠算力的再一次進(jìn)化,為了支持更多部件的熱插拔保護(hù),G7算力平臺(tái)支持PSU、風(fēng)扇、硬盤、OCP網(wǎng)卡等多個(gè)部件的Efuse保護(hù)機(jī)制,當(dāng)出現(xiàn)異常時(shí)可實(shí)現(xiàn)毫秒級(jí)直接熔斷,為系統(tǒng)提供強(qiáng)力保護(hù)。
除了產(chǎn)品級(jí)的嚴(yán)苛設(shè)計(jì),浪潮信息自有的王牌實(shí)驗(yàn)室——"澎湃實(shí)驗(yàn)室"對(duì)每款產(chǎn)品都要進(jìn)行2000多項(xiàng)測(cè)試,包括30余項(xiàng)極限測(cè)試,開發(fā)的工藝文件、生產(chǎn)品控標(biāo)準(zhǔn)經(jīng)由信息系統(tǒng)分發(fā)至世界各地工廠,通過(guò)智能制造系統(tǒng)統(tǒng)一執(zhí)行,從而實(shí)現(xiàn)全球高品質(zhì)交付。