omniture

智算中心新趨勢:摩爾定律放緩,融合架構或迎“黃金十年”

2020-08-17 14:19 7600
2020年,被納入政府工作報告的“新基建”主要以數(shù)字化、智能化為主基調(diào)。日前,浪潮信息副總裁張東在接受媒體采訪時表示,智算中心是“新基建”數(shù)字基礎設施的主力軍,智算中心所承載的AI算力將是驅(qū)動智慧時代發(fā)展的核心動力。

北京2020年8月17日 /美通社/ -- 2020年,被納入政府工作報告的“新基建”主要以數(shù)字化、智能化為主基調(diào)。圍繞著5G、云計算、人工智能展開,全力構建信息數(shù)字化基礎設施,助推我國社會經(jīng)濟高質(zhì)量發(fā)展?!靶禄ā睆娬{(diào)數(shù)字基礎設施對高新科技發(fā)展的重要作用。

日前,浪潮信息副總裁張東在接受媒體采訪時表示,智算中心是“新基建”數(shù)字基礎設施的主力軍,智算中心所承載的AI算力將是驅(qū)動智慧時代發(fā)展的核心動力。

1、數(shù)據(jù)中心被譽為新基建中的基礎設施,新一輪數(shù)據(jù)中心迅猛發(fā)展的驅(qū)動力是什么?

過去十年,數(shù)字經(jīng)濟蓬勃發(fā)展,深刻改變了人們的生產(chǎn)和生活方式,算力已經(jīng)成為了數(shù)字經(jīng)濟發(fā)展的核心生產(chǎn)力。數(shù)據(jù)中心作為算力的生產(chǎn)供應中心正在驅(qū)動科技創(chuàng)新向商業(yè)、科研等各個領域擴展。

近年來,互聯(lián)網(wǎng)的發(fā)展使得互聯(lián)網(wǎng)數(shù)據(jù)中心成為了主流。最初,互聯(lián)網(wǎng)的數(shù)據(jù)中心主要是自用。隨著云計算概念的提出,云計算數(shù)據(jù)中心蓬勃發(fā)展且規(guī)模不斷擴張。近幾年中國主要互聯(lián)網(wǎng)公司的數(shù)據(jù)中心規(guī)模擴張主要源于公有云業(yè)務的發(fā)展。

新一輪數(shù)據(jù)中心的迅猛發(fā)展有個非常重要的原因 -- 人工智能和邊緣計算。人工智能的蓬勃發(fā)展使得數(shù)據(jù)中心里面增加了大量面向人工智能的設備并對外提供人工智能的服務,云、大數(shù)據(jù)、人工智能的融合發(fā)展,也加速促進了融合架構數(shù)據(jù)中心基礎設施的建設。此外,物聯(lián)網(wǎng)、5G的發(fā)展,邊緣計算也逐漸興起,在這樣的情況下,對數(shù)據(jù)中心的需求也會逐漸增長。

在智慧時代,數(shù)據(jù)中心將成為數(shù)字經(jīng)濟社會發(fā)展的重要基石,其規(guī)?;l(fā)展一定是未來趨勢。

2、數(shù)據(jù)中心的形態(tài)一直在不斷演進,2020年4月,浪潮提出,未來的數(shù)據(jù)中心會演變?yōu)椤爸撬阒行摹保绾卫斫狻爸撬阒行摹边@個概念?

數(shù)據(jù)中心在每一個歷史時期所承載的應用和運行模式都不一樣。浪潮認為,未來的數(shù)據(jù)中心將以“云計算+大數(shù)據(jù)+人工智能”為核心特征,并據(jù)此提出了“智算中心”的概念。智算中心的提出,兼具了從技術和基礎設施兩方面的考慮。

智算中心是智慧時代最主要的計算力生產(chǎn)中心和供應中心之一,它以融合架構計算系統(tǒng)為平臺,以數(shù)據(jù)為資源,能夠以強大算力驅(qū)動AI模型來對數(shù)據(jù)進行深度加工,源源不斷產(chǎn)生各種智慧計算服務,并通過網(wǎng)絡以云服務形式向組織及個人進行供應。

首先,從技術層面來講,智算中心將更多地面向人工智能,以云計算為基礎,通過處理海量數(shù)據(jù),對外輸出各種各樣的人工智能的服務,做到“云+數(shù)+智”一體化。目前,人工智能計算需求正呈指數(shù)級增長,未來將占據(jù)80%以上的計算需求。因此,我們提出“智算”,與傳統(tǒng)的超算中心或者商業(yè)數(shù)據(jù)中心相比,“智”更強調(diào)其對于人工智能發(fā)展的重要意義。

其次,智算中心是具有公共性的基礎設施,要為各行業(yè)提供公共服務。現(xiàn)在互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)中心發(fā)展得很快,一些創(chuàng)新型業(yè)務和技術得到了快速發(fā)展。相比之下,許多傳統(tǒng)行業(yè)在數(shù)字化轉(zhuǎn)型方面還任重道遠,其中一個重要的阻礙就是數(shù)字基礎設施的缺失。所以,浪潮認為智算中心要具有基礎設施的公共性,就像移動網(wǎng)絡和高速公路一樣,做到普適普惠,發(fā)揮社會價值。

未來,計算力就是生產(chǎn)力,浪潮提出“智算中心”,致力于將其建設為計算力生產(chǎn)中心和供應中心,高效、惠普地以云服務形式向組織及個人提供智慧計算服務。

3、“融合”正成為數(shù)據(jù)中心的建設之道,浪潮也提到“智算中心的融合”,那么如何理解“智算中心的融合”?

未來的數(shù)據(jù)中心,在物理形態(tài)上趨于分散,在業(yè)務邏輯上更加集中,計算、存儲和網(wǎng)絡將趨向融合。

“融合”是智算中心非常重要的特點,“融合”包含三個層面。第一個層面是智算中心內(nèi)部的技術融合,也即“融合架構”。浪潮認為未來的數(shù)據(jù)中心,計算、存儲和網(wǎng)絡之間的邊界會越來越模糊,它們會融合為“資源池”,通過軟件來進行資源劃分。

第二個層面的融合是智算中心與智算中心之間的融合。一個數(shù)據(jù)中心的規(guī)模再大也不可能解決全中國的問題。所以未來的數(shù)據(jù)中心,會是物理上分散,邏輯上集中的。這就需要我們在建設智算中心之初,就在標準層面實現(xiàn)互聯(lián)互通,在未來做到不同的智算中心之間,也能夠?qū)崿F(xiàn)數(shù)據(jù)的流通、業(yè)務上的流通。

第三個層面的融合是智算中心和各行業(yè)的融合。智算中心要真的變成基礎設施,就要深度嵌入到各個行業(yè)之中,和CT、OT、智能制造以及傳統(tǒng)行業(yè)做全面的融合。只有這樣,才能實現(xiàn)智算中心覆蓋生產(chǎn)生活全部場景的普適普惠。

4、未來,算力將成為重要的資源。然而,摩爾定律率漸漸觸及天花板。這對智算中心的算力供應會構成什么影響?

摩爾定律的變緩,恰恰為融合架構的發(fā)展帶來了新的“黃金十年”。

新的芯片技術更新迭代的速度有所放緩,單純靠芯片去提升算力性能,在發(fā)展上遇到了瓶頸。摩爾定律雖然放緩,但在計算能力的提升方面,仍然有許多機會。  

首先,專用計算芯片的興起和新型計算模式的研究創(chuàng)新,在傳統(tǒng)硅基半導體工藝的放緩的情況下,為緩解算力激增的需求提供的新的解決路徑。采用專用的芯片來彌補計算處理能力的不足得到了廣泛的應用,比較典型的是,近幾年AI芯片及加速芯片的興起,GPU、FPGA、xPU等各種加速器芯片的創(chuàng)新和使用,在AI深度學習訓練和線上推理等應用場景很好的滿足了AI算力爆發(fā)式增長的需求。

第二,一些新的計算技術、新型存儲介質(zhì)、新的晶體管設計方法和分子層次的計算技術也在加速應用,例如量子計算、生物計算、光子計算技術等,為算力層面的加速創(chuàng)新提供了更大的發(fā)展空間;再比如非易失內(nèi)存DCPMM,其單條內(nèi)存容量最大可以到512GB,使得推理作業(yè)密度提升一倍,每單位作業(yè)成本下降近50%。

第三,在體系結構層面,融合架構的快速發(fā)展也在加速軟硬件設計的協(xié)同創(chuàng)新。在硬件層面,通過硬件重構實現(xiàn)資源池化。CPU與GPU、FPGA、xPU等各種加速器將更加緊密結合,利用全互聯(lián)NVSwitch、CXL、Open CAPI等新型超高速內(nèi)外部互連技術,實現(xiàn)異構計算芯片的融合;在軟件層面,通過軟件定義,在可重構的硬件資源池基礎上,通過靈活的組織,將不同的資源池組成專業(yè)的服務器、存儲、網(wǎng)絡系統(tǒng),并實現(xiàn)資源的高效管理和調(diào)度以及數(shù)據(jù)在池化資源的靈動流轉(zhuǎn)。當AI與軟件定義結合后,賦予了軟件定義更高級的含義。

目前,浪潮的整機解決方案也在不斷進行體系結構的創(chuàng)新。浪潮通過“硬件重構”與“軟件定義”兩個層面共同驅(qū)動“融合架構”創(chuàng)新。浪潮在融合架構技術路線的指引下,持續(xù)鞏固算力系統(tǒng)、云數(shù)智平臺層面的優(yōu)勢,提供人工智能服務器、通用計算服務器、關鍵計算服務器,也會面向海量數(shù)據(jù)和高速互聯(lián)提供存儲和網(wǎng)絡品。此外,將技術棧持續(xù)往底層延伸,面向不同的場景,最終形成覆蓋芯片、系統(tǒng)、平臺和算法的領先產(chǎn)品體系。

5、浪潮是中國歷史悠久的IT企業(yè),也在不斷追求技術創(chuàng)新,那么目前浪潮在哪些方面去響應 “新基建”發(fā)展?

浪潮對于未來智算中心基礎設施的業(yè)務探索和布局,可能比“新基建”熱點還要早。

首先,浪潮這幾年發(fā)展策略和數(shù)據(jù)中心的發(fā)展方向非常吻合。開放計算是未來的產(chǎn)業(yè)趨勢,是智算中心的基石。無論是底層的芯片,還是系統(tǒng)、平臺、算法,整個技術和產(chǎn)品體系的發(fā)展都更趨于開放。在推進開放計算發(fā)展的過程中,浪潮參與了RISC-V、OpenStack、OCP、ODCC、Open19等各類主流的軟硬件開放社區(qū)和組織。同時,以OpenStack、K8s等開放基礎設施為底座,融入AIOps和人工智能訓練推理平臺,構建了云數(shù)智一體化開放平臺能力,開放計算已經(jīng)成為浪潮整個業(yè)務戰(zhàn)略中非常重要的方向。

其次,浪潮也率先布局人工智能。在人工智能層面,浪潮從產(chǎn)品、平臺和生態(tài)三方面來打造AI能力。產(chǎn)品層面,浪潮打造了全球領先的人工智能服務器;平臺層面,推出了領先的人工智能資源管理平臺AIStation,以實現(xiàn)AI資源的高效調(diào)度管理。另外,為推進人工智能的生態(tài)建設,加速產(chǎn)業(yè)AI化應用,浪潮提出了“元腦生態(tài)”,聯(lián)合具備AI開發(fā)核心能力的左手伙伴和具備行業(yè)整體方案交付能力的右手伙伴,真正解決傳統(tǒng)行業(yè)的AI落地問題。

最后,浪潮通過創(chuàng)新的JDM協(xié)同創(chuàng)
新模式,為大型CSP用戶和傳統(tǒng)行業(yè)用戶提供全程定制化的產(chǎn)品和服務。浪潮具有領先的快速研發(fā)能力,能夠在最短時間內(nèi)設計出符合用戶的需求的產(chǎn)品和方案。目前,從0開始,浪潮可以在3個月內(nèi)提供樣機,9個月具備批量供貨能力。2019年1月10日,浪潮在百度數(shù)據(jù)中心創(chuàng)造了單數(shù)據(jù)中心單日交付10000節(jié)點服務器的交付紀錄,這些服務器是整機柜形態(tài),可以模塊化整體交付。

在這一系列實踐中,浪潮其實早已經(jīng)契合新基建政策,助力數(shù)字經(jīng)濟發(fā)展,推動智慧社會建設。

 

消息來源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection