北京2021年11月11日 /美通社/ -- 中汽創(chuàng)智科技有限公司由中國一汽、東風公司、長安汽車、南京江寧經開科技等企業(yè)共同出資160億元設立,落戶南京江寧經濟技術開發(fā)區(qū)。
中汽創(chuàng)智選擇浪潮分布式存儲AS13000G5系列的M和H節(jié)點,構建了自動駕駛訓練模型,進一步提升GPU集群自動駕駛模型訓練過程中的數(shù)據讀寫速度,大大加快研發(fā)速度。
中汽創(chuàng)智科技有限公司的成立,是落實制造強國、科技強國、汽車強國等國家戰(zhàn)略的重要舉措。央企新能源汽車整車領域的產業(yè)投資、技術研發(fā)將集中在中汽創(chuàng)智,有利于推動產業(yè)資源整合和開放合作,加快在制約當前產業(yè)發(fā)展的“卡脖子”技術和下一代關鍵核心技術領域的集中攻關和突破。中汽創(chuàng)智聚焦智能底盤、氫燃料動力、智能網聯(lián)三大業(yè)務領域,致力于成為汽車行業(yè)技術創(chuàng)新的引領者、產業(yè)孵化的踐行者、數(shù)據服務的驅動者。
部署自動駕駛訓練平臺,推進自動駕駛技術發(fā)展
中汽創(chuàng)智計劃建設一套自動駕駛模型訓練平臺。借助平臺的運算能力和存儲能力,為自動駕駛、人工智能等領域相關技術的研發(fā),提供IT資源支撐。
模型訓練需要頻繁在存儲設備中讀寫數(shù)據,對存儲系統(tǒng)性能要求較高,原始模型開發(fā)的過程中需要調用TB級的圖片數(shù)據集,且模型在開發(fā)的過程中也會產生很多中間數(shù)據需要存儲。
除了數(shù)據讀寫和大量圖片的處理,中汽創(chuàng)智自動駕駛訓練模型的搭建還給數(shù)據傳輸帶來挑戰(zhàn),傳統(tǒng)存儲在面對數(shù)據短時間內增長迅速,傳統(tǒng)硬盤效率低,無法發(fā)揮數(shù)據的及時性和準確性。
浪潮AS13000-H,如何HOLD住海量數(shù)據?
浪潮為中汽創(chuàng)智提供了高性能AS13000G5-H型號和13000G5-M存儲組合方案。提供了不低于50GB/s的聚合帶寬和PB級存儲空間,滿足了自動駕駛訓練模型對大量圖片處理和數(shù)據頻繁讀寫的需求。助力中汽創(chuàng)智自動駕駛訓練模型平臺的建設。
浪潮AS13000-H分布式文件存儲系統(tǒng)采用元數(shù)據節(jié)點與數(shù)據節(jié)點分離的網絡架構,元數(shù)據與數(shù)據的讀寫互不影響。同時,AS13000-H的軟件系統(tǒng)面向小文件進行了專門的調優(yōu)和設計,使得AS13000-H更加適合圖片數(shù)據集訓練這種小文件頻繁讀寫的場景。從而進一步提升GPU集群自動駕駛模型訓練過程中的數(shù)據讀寫速度,推薦配置2個元數(shù)據節(jié)點和2個數(shù)據節(jié)點。元數(shù)據節(jié)點之間,數(shù)據節(jié)點之間開啟鏡像模式,實現(xiàn)元數(shù)據和數(shù)據的兩副本存儲,通過雙副本機制,保障中汽創(chuàng)智自動駕駛模型訓練過程中數(shù)據的安全。每臺元數(shù)據節(jié)點和數(shù)據節(jié)點均配有2套網絡。一套為10Gb萬兆以太網絡,接入業(yè)務交換機,實現(xiàn)研發(fā)人員和管理人員對于存儲設備的前端接入和訪問。另外一套為100Gb EDR Infiniband網絡,接入集群內部用于數(shù)據交換的IB交換機,實現(xiàn)模型訓練過程中計算節(jié)點與存儲節(jié)點之間的數(shù)據讀寫,最大化保障數(shù)據傳輸效率。
考慮到用于模型訓練的圖片數(shù)據集及部分中間結果需要在開發(fā)機之間共享,因此,存儲設備應具備共享網盤功能,以便不同開發(fā)機之間對同一份訓練數(shù)據集進行讀寫,并對中間結果進行共享。浪潮存儲采用3臺4U36盤位存儲服務器構成分布式存儲系統(tǒng)的硬件平臺;軟件層面,使用經過浪潮商業(yè)化開發(fā)的Ceph文件系統(tǒng)。通過軟件定義存儲技術,將3臺存儲服務器定義為一臺分布式存儲系統(tǒng)。該系統(tǒng)可以同時支持文件、對象、塊三種存儲類型,本項目中使用文件存儲格式進行開發(fā)及存儲環(huán)境搭建,幫助用戶實現(xiàn)對存儲資源的最大化利用,有效降低存儲開銷,實現(xiàn)高效數(shù)據存取和維護,確保數(shù)據安全可靠。
目前,中汽創(chuàng)智自動駕駛訓練模型平臺已經全面投入使用,在智能座艙、仿真與測試、自動駕駛等多個業(yè)務中開展大數(shù)據分析和高性能訓練,與中汽創(chuàng)智的云平臺進行對接,形成統(tǒng)一的數(shù)據中心級別的大平臺。