北京2024年2月23日 /美通社/ -- 國際權威標準性能評估組織SPEC第35屆年會日前在美國舉行。會上,SPEC組織確定新一年工作計劃,為推動AI算力產業(yè)的更快發(fā)展,國際最新AI算力評測標準SPEC ML即將發(fā)布,該標準由浪潮信息、NVIDIA、Intel、AMD、Red Hat等成員聯合開發(fā)。
與業(yè)界一般AI算力評測標準不同,「國際最新AI算力評測標準SPEC ML」模擬了AI訓練和推理不同場景的端到端全棧流程,涵蓋業(yè)界最豐富的主流AI工作負載,評估包括多個AI場景的綜合性能、集群擴展性、能效等多種關鍵參數,可以幫助用戶更好地理解算力系統(tǒng)的瓶頸并進行優(yōu)化,是一款更貼近用戶真實AI業(yè)務需求的算力測試基準。目前,浪潮信息、NVIDIA、Dell等企業(yè)正針對SPEC ML評測標準率先開展測試工作,國際最新AI算力評測標準的重大發(fā)布,將幫助用戶更全面地了解AI算力系統(tǒng)的性能、擴展性及能效水平。
此外,SPEC ML技術委員會舉行換屆選舉,浪潮信息和英特爾連任技術委員會主席、副主席。
近年來,隨著人工智能產業(yè)快速興起,也激發(fā)了AI算力的爆發(fā)式增長。過去10年,AI計算的能力已經提高了不低于100萬倍,但要滿足像ChatGPT這類擁有巨量的參數和深度網絡結構的大模型,算力性能提升還面臨巨大的挑戰(zhàn)。為了推動AI算力技術發(fā)展,更好評估不同芯片、算法、計算框架的AI算力性能表現,方便用戶選擇適合自己的計算解決方案,業(yè)界涌現出一批AI測評基準,比如MLPerf、AIPerf、DeepBench等。一般評測基準測試中,比如訓練場景,會忽略需要大規(guī)模數據集的預訓練過程,直接進行模型訓練場景測試,而且僅會測試算力系統(tǒng)在ResNet50、SSD、Transformer、Bert等某個單一場景下的極限性能。但隨著模型規(guī)模越來越大,從單節(jié)點到大規(guī)模集群,訓練流程更加復雜,模態(tài)算法也更加豐富,需要更貼合用戶真實訓練場景的評測基準,系統(tǒng)評估算力系統(tǒng)面向多種AI工作負載的綜合性能、集群擴展性、能效等多種關鍵參數。
過去一年,SPEC ML技術委員會面向用戶更復雜的訓練流程、更豐富的AI負載,完成了國際最新AI算力評測標準SPEC ML的開發(fā)工作。SPEC ML測試過程中,無論是訓練場景還是推理場景,測試用例會模擬用戶真實的應用環(huán)境,綜合評估基于不同芯片、不同算法框架,服務器整機在ResNet、Yolo、SSD、3D U-Net、MobileNet、BERT等10多種AI工作負載下的綜合性能,以及多節(jié)點集群擴展性能、能效、關鍵系統(tǒng)性能參數等,尤其是Diffusion、Bloom等負載的加入,實現了對諸如大模型等AI熱點應用的性能評測,幫助用戶更全面地了解AI算力系統(tǒng)的性能及能效水平。本次大會,SPEC ML技術委員會展示了ML測試工具,測試基準的架構、各項功能及展現結果等,獲得SPEC領導層及各成員的高度評價。
SPEC是一個全球性的、權威的第三方應用性能測試組織,組織成員包括英特爾、甲骨文、NVIDIA、蘋果、微軟、浪潮信息、加州大學伯克利分校、清華大學等,擁有SPEC CPU、SPEC Power、SPEC Cloud等十幾項測試基準,真實模擬了企業(yè)不同應用場景下的整機性能、能效,是各類企業(yè)用戶的采購和信息系統(tǒng)搭建的重要決策依據之一。作為新一屆SPEC OSSC委員,浪潮信息將繼續(xù)承擔SPEC ML、SPEC CPU、SPEC Power、SPEC Cloud等技術小組日常工作審查、重大事項決策、測試研究及決策測試標準的發(fā)展方向等職責。