北京2021年10月21日 /美通社/ -- “推進(jìn)教育新型基礎(chǔ)設(shè)施建設(shè)構(gòu)建高質(zhì)量教育支撐體系的指導(dǎo)意見(jiàn)”明確將高性能計(jì)算平臺(tái)(以下簡(jiǎn)稱“HPC”)定位于“智慧科研設(shè)施”領(lǐng)域之中。HPC作為高等院校教科研的關(guān)鍵算力平臺(tái),其在氣象預(yù)報(bào)、地質(zhì)勘探、生物科學(xué)以及宏觀經(jīng)濟(jì)預(yù)測(cè)等教學(xué)、科研的過(guò)程中已經(jīng)成為一個(gè)關(guān)鍵抓手。
HPC備受高等院校青睞,其最初的動(dòng)因來(lái)自于科學(xué)研究領(lǐng)域中,人們對(duì)于“第三范式”,即計(jì)算科學(xué)的依賴。伴隨著大數(shù)據(jù)、人工智能等領(lǐng)域在教學(xué)科研中所扮演的角色越加重要,以及關(guān)于科研領(lǐng)域“第四范式”,即數(shù)據(jù)密集型科學(xué)議題的出現(xiàn),使得當(dāng)下高等院校對(duì)服務(wù)于科研領(lǐng)域的核心算力平臺(tái)有了新的需求。
以傳統(tǒng)HPC為代表的高??蒲兴懔ζ脚_(tái),正在朝著既能滿足HPC,又可以實(shí)現(xiàn)AI、大數(shù)據(jù)等計(jì)算服務(wù)的算力平臺(tái) -- “智算中心”演進(jìn)升級(jí)。浪潮前瞻性地提出了“智算中心”,其在高校構(gòu)建智慧科研設(shè)施的過(guò)程中,滿足了師生們?cè)诮虒W(xué)與科研的過(guò)程中對(duì)多元算力的要求。算力平臺(tái)對(duì)于底層網(wǎng)絡(luò)基礎(chǔ)設(shè)施,在架構(gòu)、性能、運(yùn)維等方面提出的挑戰(zhàn)伴隨算力多元化而來(lái)。浪潮網(wǎng)絡(luò)依托浪潮集團(tuán)在“智算中心”領(lǐng)域所擁有的整體實(shí)力,作為中國(guó)創(chuàng)新型網(wǎng)絡(luò)產(chǎn)品、技術(shù)、方案供應(yīng)商,針對(duì)智慧科研設(shè)施HPC算力平臺(tái)的新需求、新趨勢(shì),推出了“高等院校HPC網(wǎng)絡(luò)解決方案”。
HPC+AI 科研算力平臺(tái)面臨的升級(jí)之“困”
高校在圍繞“智算中心”構(gòu)建智慧科研基礎(chǔ)設(shè)施的過(guò)程中,一方面要解決當(dāng)下現(xiàn)有科研算力分散的“短板”,同時(shí)還面臨如何化解全新多元科研算力對(duì)于底層網(wǎng)絡(luò)平臺(tái)提出的挑戰(zhàn)。
長(zhǎng)期以來(lái),部分高校的HPC建設(shè)并未得到有效整合,造成算力資源利用效率不高、平臺(tái)運(yùn)維管理繁重。與此同時(shí),AI、大數(shù)據(jù)應(yīng)用的激增,加劇了科研“算力孤島”現(xiàn)象的增多。通過(guò)整合現(xiàn)有科研算力,不僅能夠充分釋放算力效能,同時(shí)在算力能耗、運(yùn)維管理等方面也會(huì)帶來(lái)質(zhì)的改變。
網(wǎng)絡(luò)基礎(chǔ)架構(gòu)作為科研算力平臺(tái)的關(guān)鍵一環(huán),面對(duì)算力多元化、巨量化的發(fā)展趨勢(shì),其在架構(gòu)、技術(shù)上需要做出全新的改變。在國(guó)家信息中心聯(lián)合浪潮所發(fā)布的《智能計(jì)算中心規(guī)劃建設(shè)指南》中,圍繞科研算力平臺(tái)建設(shè)指出 -- 針對(duì)HPC、大數(shù)據(jù)以及AI等應(yīng)用需求,現(xiàn)有的數(shù)據(jù)中心網(wǎng)絡(luò)在彈性、可擴(kuò)展性以及功能靈活性等方面都存在不足,難以勝任當(dāng)前科研算力這類大規(guī)模計(jì)算集群的需求。
科研算力向“智算”升級(jí) 網(wǎng)絡(luò)基座需先行
作為全球領(lǐng)先的HPC解決方案提供商 -- 浪潮為高校提供的科研算力平臺(tái),具備從計(jì)算節(jié)點(diǎn)、異構(gòu)加速、并行存儲(chǔ)、高速網(wǎng)絡(luò)、集群管理的全棧解決方案。而浪潮網(wǎng)絡(luò)圍繞科研算力平臺(tái)的應(yīng)用特點(diǎn)和技術(shù)難點(diǎn),在網(wǎng)絡(luò)架構(gòu)、技術(shù)及設(shè)備選用等維度,提供了完備的解決方案。
為了有效支撐異構(gòu)算力平臺(tái),例如AI、大數(shù)據(jù)等應(yīng)用的需求,以及滿足數(shù)值計(jì)算的HPC應(yīng)用所需,浪潮網(wǎng)絡(luò)在整體架構(gòu)層面,采用Spine-Leaf網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),替代傳統(tǒng)的胖樹(shù)結(jié)構(gòu),構(gòu)建端到端無(wú)阻塞、無(wú)收斂的高速數(shù)據(jù)轉(zhuǎn)發(fā)網(wǎng)絡(luò)。在此基礎(chǔ)上,浪潮網(wǎng)絡(luò)通過(guò)提供支持 RoCE的網(wǎng)絡(luò)設(shè)備,在以太網(wǎng)上實(shí)現(xiàn)了RDMA 功能,為HPC這類數(shù)據(jù)密集型計(jì)算任務(wù)提供了超低的數(shù)據(jù)延遲高速交換和高效的網(wǎng)絡(luò)資源利用率,在絕大部分HPC場(chǎng)景中可有效替代傳統(tǒng)上昂貴的基于Infiniband的解決方案,同時(shí)浪潮網(wǎng)絡(luò)的HPC解決方案已在大量的985、211院校得到規(guī)模應(yīng)用。
在浪潮網(wǎng)絡(luò)HPC解決方案中,CN12900、CN9000、CN6000等高速低延遲數(shù)據(jù)中心交換機(jī),在無(wú)損以太網(wǎng)、支持RoCE等方面的特點(diǎn),為高校科研算力平臺(tái)構(gòu)建起一套具備高冗余、低延遲、無(wú)阻塞的網(wǎng)絡(luò)基礎(chǔ)平臺(tái)。整套解決方案不僅確保了科研算力平臺(tái)高速、安全、穩(wěn)定運(yùn)行,同時(shí)其所具備的靈活、彈性的系統(tǒng)升級(jí)、擴(kuò)容能力,也使得科研算力平臺(tái)的投入更加合理可控。