北京2022年7月27日 /美通社/ -- 大腦包含上百億神經元,是人體身上最重要和最復雜的器官,復雜性遠遠超出了我們當前的認識能力。腦科學研究不僅是全球科技的前沿領域,也是理解人類本身的終極目標。為了加快了腦科學研究的步伐,"腦科學與類腦研究" 于2016年正式啟動,吸引了眾多頂尖科學家投身其中。以探索大腦秘密、攻克大腦疾病為導向的腦科學研究,以及以建立和發(fā)展人工智能技術為導向的類腦研究開啟了新的征程。作為國內高校最早成立的腦科學與類腦前沿交叉研究機構之一,復旦大學類腦人工智能科學與技術研究院(簡稱類腦研究院),面向腦與類腦重大科技前沿,依托學科優(yōu)勢,借助領先的計算、數(shù)據(jù)平臺,致力于在類腦人工智能算法、重大腦疾病智能診療等領域創(chuàng)新,引領腦科學、人工智能與產業(yè)應用的融合,實現(xiàn)未來智能產業(yè)技術創(chuàng)新。
為了建成世界一流的腦與類腦前沿研究和科技創(chuàng)新機構,加速腦科學與類腦研究進程,復旦大學類腦研究院需要采用多維度、高精度的設備進行科研數(shù)據(jù)的采集、傳輸、使用。類腦研究設備涉及腦成像平臺、磁共振成像設備系統(tǒng)、多臺近紅外光、腦電、腦磁圖等實時腦功能監(jiān)測系統(tǒng),以及直流電刺激、經顱磁刺激、超聲腦刺激等腦調控系統(tǒng)。認知神經科學平臺擁有光學腦成像設備及認知行為解析設備,這些設備進行科學研究時產生了大量影像數(shù)據(jù)。在組建人腦大數(shù)據(jù)庫的科研項目中,復旦大學類腦研究院利用各種無創(chuàng)手段,以基因測序為主,對抑郁癥、精神分裂癥、健康人等不同類型的人群,并發(fā)采集其環(huán)境、行為、遺傳、腦影像、神經等千萬級小文件數(shù)據(jù)信息,推動重大腦疾病如抑郁癥、精神分裂癥、自閉癥和物質濫用的病根構建并預測人腦的創(chuàng)造性、幸福感和毅力等各種宏觀指標,這對整個大平臺的數(shù)據(jù)基礎設施有著比較大的挑戰(zhàn)和要求。
首先是對數(shù)據(jù)容量的要求:研究院部署較早的傳統(tǒng)存儲擴展能力受限制,且配置6TB及以上大容量硬盤采用RAID 6、RAID 10,空間利用率小于50%,在容量利用方面存在巨大提升空間。
其次是要有穩(wěn)定的性能支撐:基因測序的生產過程是一個超高并發(fā)的文件轉換過程,整個生產過程有非常密集的文件讀取和寫入。一個完整的基因測序樣本會產生千萬量級的文件,通過測序儀、分析儀等儀器獲得包含原始基因序列堿基對的文件,大小大約幾十GB。整個生物樣本的導入過程對文件存儲的性能有著極高的要求,滿足不同科研任務對不同文件高帶寬的存儲需求,既要文件系統(tǒng)必須提供超大文件數(shù)量的支持,同時必須在有限的時間內完成海量小文件的導入。
最后需要對設備和用戶的進行高效和精準管理:一是用戶層次多,類腦研究院擁有從本科生至博士生,以及各類研究員的使用者;在研究的過程中類腦研究院的教授、研究員及學生需要設置不同的級別,以防止重要數(shù)據(jù)的誤操作;二是多臺設備的使用,使得故障點隱患增加,管理及配置難以統(tǒng)一化,運維壓力較大。
浪潮存儲,助力類腦研究基礎平臺建設
針對全腦網絡可視化研究場景及相關需求,復旦大學類腦研究院采用了浪潮提供的專業(yè)化的存儲解決方案。
復旦大學類腦研究院采用浪潮分布式存儲AS13000,可按需提供文件、對象、塊、大數(shù)據(jù)等多種服務,采用8+2糾刪碼策略提供了3PB容量空間,空間利用率達到80%;方案統(tǒng)一化管理,降低多套設備部署和維護的復雜度,允許集群內同時故障2個節(jié)點,業(yè)務不中斷,數(shù)據(jù)不丟失,保障了業(yè)務連續(xù)性。
浪潮存儲通過對象聚合技術,提升單次落盤的對象大小,降低落盤操作次數(shù),單節(jié)點恒定聚合帶寬達2GB/s以上,確?;驕y序的連續(xù)性。
針對高校多個學科與多個課題組共享、使用、管理數(shù)據(jù)會產生多份數(shù)據(jù),浪潮存儲為復旦大學定制了軟拷貝功能,在元數(shù)據(jù)索引上做變更,用戶視角是多份不同的文件,但底層則是共同的存儲空間,實現(xiàn)多份數(shù)據(jù)極速拷貝和使用,還大幅降低了存儲容量開銷和管理成本,讓數(shù)據(jù)共享、使用變得更加高效。浪潮存儲平臺還通過部署增強ACL,支持讀、寫、執(zhí)行、可視、刪除,滿足對不同用戶的精細權限控制:保證研究員、學生和管理者等不同用戶對數(shù)據(jù)的訪問和存儲有不同的權限,有效防止誤操作。
復旦大學類腦研究院下設的生物醫(yī)學大數(shù)據(jù)中心---張江國際腦庫(ZIB),不斷加強高性能計算與存儲能力建設,目前擁有6個隊列、15000例被試、30 PB存儲、1005 份問卷,形成了國內領先的生物大數(shù)據(jù)、云計算平臺。預計到2023年,張江國際腦庫將圍繞精神分裂癥、抑郁癥、自閉癥、腦卒中、神經退行性疾病以及正常人群的六個隊列建設,完成環(huán)境、行為、遺傳、腦影像、神經5-O尺度等全維度數(shù)據(jù)采集,建成全球最大規(guī)模的全維度腦數(shù)據(jù)庫和算法中心,服務腦科學基礎研究、腦疾病臨床診療與類腦智能新興產業(yè)的發(fā)展。
同時該機構還將與全球主流生物數(shù)據(jù)庫建立合作共享機制,推動構建全球頂級規(guī)模的全維度腦數(shù)據(jù)庫和算法中心。無論是腦科學還是類腦研究,對提升未來中國科技整體智慧水平、提高經濟發(fā)展質量、促進人類的生產生活方式的轉變均意義重大。