北京2023年8月11日 /美通社/ -- 即便是以"燒錢"著稱的一級方程式比賽(F1),也要為算力性價比做打算,作為全球最負(fù)盛名的賽車比賽之一, F1在計算流體力學(xué)(CFD)模擬的支持下實現(xiàn)那些令賽車迷血脈賁張的"地表最快賽車"和數(shù)百公里時速下的輪對輪對決。
幾年前,F(xiàn)1將其CFD模擬遷移至亞馬遜云科技的高性能計算(HPC)平臺,并引入基于Amazon Graviton2處理器的Amazon EC2 C6gn實例。這不僅使CFD模擬時間大幅縮短,還使成本降低了30%。隨著基于新一代Amazon Graviton3處理器的Amazon EC2 C7g實例的推出,F(xiàn)1又成為該實例首批使用的用戶之一。F1首席技術(shù)官Pat Symonds表示"在同樣的模擬中,基于Graviton3的C7g實例比C6gn實例快了40%。我們期待Graviton3成為運行所有CFD工作負(fù)載的最佳選擇。"
這代表了眾多涉及算力需求的企業(yè)與機構(gòu)用戶的訴求——在算力作為基本資源的數(shù)字經(jīng)濟時代,其性能與成本對其業(yè)務(wù)的影響與日俱增。高性價比的算力,往往是用戶選擇云計算的根本出發(fā)點之一。人工智能(AI)、機器學(xué)習(xí)(ML)等應(yīng)用不斷加劇算力供需和成本之間的矛盾。在云端獲得更加高性價比的算力不僅是用戶永恒不變的追求,也成了云計算供應(yīng)商的核心要務(wù)。
深入底層,Amazon Nitro變革云計算的性價比
亞馬遜云科技首席執(zhí)行官 Adam Selipsky 曾表示:"如果希望針對所有可能的工作負(fù)載徹底變革計算的性價比,還需要徹底重新思考實例。為了實現(xiàn)這個目標(biāo),我們需要深入底層技術(shù)直達芯片。"
為了打破傳統(tǒng)底層架構(gòu)的性價比桎梏,亞馬遜云科技早在十年前就走上了"自研芯片"之路,開始在基礎(chǔ)設(shè)施底層針對云環(huán)境進行"量體裁衣"的技術(shù)創(chuàng)新。亞馬遜云科技在2013年推出云服務(wù)器虛擬化引擎Amazon Nitro系統(tǒng),并于2015年收購Annapurna Labs之后便駛?cè)?quot;自研芯片"的快車道,逐漸形成由Amazon Nitro系統(tǒng)、云原生處理器Amazon Graviton、機器學(xué)習(xí)訓(xùn)練Amazon Trainium芯片和機器學(xué)習(xí)推理Amazon Inferentia芯片組成的幾大路徑,并進行快速迭代。
Nitro創(chuàng)新的將網(wǎng)絡(luò)、存儲、管理、安全和監(jiān)控的功能卸載到專用的硬件來完成,從底層變革了云計算的性價比。作為Amazon EC2實例的基礎(chǔ)平臺,Nitro不但將硬件的幾乎所有計算資源都提供給實例,其模塊化的設(shè)計在加快實例設(shè)計與交付的同時,還能與Graviton結(jié)合,進一步為客戶工作負(fù)載提供更加性價比。例如,基于Gravtion2的Amazon EC2 I4g實例,在Nitro SSD 作為 NVMe 高性能存儲的加持下,與上一代存儲優(yōu)化型實例相比I/O 延遲降低多達 60%,延遲抖動降低多達 75%,與類似的基于x86的存儲優(yōu)化型實例相比,計算性能提高達 15%。
更進一步,Amazon Graviton持續(xù)突破云計算性價比
Nitro拉開了亞馬遜云科技定制芯片的大幕,隨后的云原生處理器Amazon Graviton則更進一步,打破原有的云計算算力成本規(guī)則。Graviton處理器基于ARM架構(gòu),相比X86架構(gòu),其在架構(gòu)與設(shè)計理念上完全為適應(yīng)多用戶的公有云環(huán)境而生,具有成本低和核心密度高等特性。例如在性能分配上,與x86在單物理核心運行多個虛擬處理器(vCPU)不同,Graviton處理器的每個vCPU都獨占一個物理核心,這樣的設(shè)計從硬件層面就避免了云端高并發(fā)任務(wù)時爭奪vCPU性能的情況,使不同用戶都能獲得穩(wěn)定且一致的vCPU算力。
從2018年問世至今,Graviton處理器進行了三次重大迭代,每一代Graviton都保持著大幅度的性能提升。其中,2020年推出的Graviton2與第一代Graviton相比,處理器性能提升7倍、計算核心數(shù)量多達4倍、緩存達到2倍、內(nèi)存速度達到5倍。2021年推出的Graviton3,單核性能比Graviton2又提升25%,浮點性能提升2倍,并首次在云計算芯片中采用性能更強、功耗更低的DDR5內(nèi)存;Graviton3的能效也更高,在相同性能下,與同類型EC2實例對比,可節(jié)省高達60%的能源消耗。
去年年底,亞馬遜云科技又發(fā)布了專門對浮點和向量指令運算進行了優(yōu)化的Graviton3E,聚焦于為CFD、天氣模擬、基因組學(xué)和分子動力學(xué)等高性能計算工作負(fù)載提供性能優(yōu)化與更優(yōu)性價比。Graviton3的推出又一次刷新前代產(chǎn)品的性價比表現(xiàn),很多獲益于Graviton2的客戶都表示愿意積極嘗試。在基于Graviton3的Amazon EC2 C7g實例尚處在預(yù)覽階段時,Twitter就對其進行了多項工作負(fù)載基準(zhǔn)測試,最終發(fā)現(xiàn)C7g實例相較于基于Graviton2的C6g有著20%-80%的性能提升,同時還將尾部延遲降低了35%。
Graviton3 以及Graviton3E處理器的推出,進一步體現(xiàn)了亞馬遜云科技自研芯片與傳統(tǒng)架構(gòu)不同的算力升級理念。Graviton3在并未大幅改變處理器主頻的前提下,轉(zhuǎn)而依托高效的數(shù)據(jù)并行和指令并行,可在單位時間內(nèi)執(zhí)行兩倍于前代產(chǎn)品的指令和數(shù)據(jù)處理,還采用了更具性價比的Chiplet封裝,不但大幅提升了執(zhí)行效率,并保持了良好的能效比。
Amazon Graviton規(guī)?;瘧?yīng)用帶來廣泛的系統(tǒng)及軟件支持
基于Graviton處理器的Amazon EC2實例在Graviton2推出后快速增加,目前基于Graviton2的實例就有100多個,涵蓋通用、計算優(yōu)化型、內(nèi)存優(yōu)化型、存儲優(yōu)化型、加速計算型等10多個種類,為客戶廣泛的工作負(fù)載提供極佳的算力性價比,成為眾多客戶在亞馬遜云科技獲得大規(guī)模云端算力的全新可選項。
為了讓客戶更輕松、方便的獲得Graviton帶來的算力性價比優(yōu)勢,亞馬遜云科技進一步將客戶常用的托管服務(wù)運行在Graviton2之上,包括Amazon Relational Database Service、Amazon Aurora、Amazon ElastiCache、Amazon MemoryDB for Redis、Amazon OpenSearch、Amazon EMR、Amazon Elastic Kubernetes Service和Amazon Lambda等。目前運行在Graviton2之上的亞馬遜云科技托管服務(wù)已有20多種,這一數(shù)字還在基于客戶需求持續(xù)增加。托管服務(wù)大幅降低了客戶將應(yīng)用遷移到 Graviton的復(fù)雜度,時間可以從幾天降低到幾分鐘,而且轉(zhuǎn)移到Graviton實例上即可實現(xiàn)高達40%的性價比提升。
同時,Graviton處理器的規(guī)模化應(yīng)用為全行業(yè)帶來如漣漪擴散般的連鎖效應(yīng)——越來越多的系統(tǒng)與軟件,如大多數(shù)流行的 Linux 操作系統(tǒng)(包括 Amazon Linux 2、Red Hat Enterprise Linux、SUSE 和 Ubuntu 等)都支持Graviton;由亞馬遜云科技和第三方軟件供應(yīng)商提供的,適用于安全、監(jiān)控與管理、容器以及持續(xù)集成和交付 (CI/CD) 的很多熱門應(yīng)用程序和服務(wù)也支持基于Graviton處理器的實例。廣泛的系統(tǒng)及軟件對Graviton的支持,讓客戶可根據(jù)業(yè)務(wù)所需進行自由靈活的選擇,讓其更廣泛的工作負(fù)載受益。
不止芯片創(chuàng)新,亞馬遜云科技整體硬件創(chuàng)新為客戶帶來可持續(xù)的算力
從初代Graviton處理器問世至今僅五年,亞馬遜云科技針對Graviton可用性及其軟硬件支持體系開啟了 "正向螺旋式上升"。如今,使用Graviton處理器獲得更優(yōu)性價比的企業(yè)和機構(gòu)已覆蓋幾乎所有涉及云計算的主流行業(yè)。亞馬遜云科技的持續(xù)創(chuàng)新,遠(yuǎn)不局限于基于ARM架構(gòu)的Graviton處理器,還包括實現(xiàn)虛擬化平臺底座的Nitro系統(tǒng)、機器學(xué)習(xí)加速處理芯片、服務(wù)器硬件以及數(shù)據(jù)中心基礎(chǔ)設(shè)施在內(nèi)的整體創(chuàng)新。未來,隨著Graviton處理器的不斷升級,亞馬遜云科技將進一步讓客戶簡單、快捷地獲得更佳性能、更優(yōu)成本以及可持續(xù)的算力。