深圳2022年12月30日 /美通社/ -- 近日,暨南大學(xué)、華南理工大學(xué)團隊發(fā)表論文Towards an accurate and robust analysis pipeline for somatic mutation calling,比較了突變檢測算法在癌癥領(lǐng)域常見的低頻突變標準測試數(shù)據(jù)集上的性能,發(fā)現(xiàn)國產(chǎn)FANSe算法的檢測效果遠勝于國際上常用的算法,速度還要快上幾十倍。這將為癌癥診療等應(yīng)用提供重要的標準化依據(jù)。
癌癥的診斷、分型、治療中,突變檢測是重要手段。特定的突變對應(yīng)著相應(yīng)的治療方案,尤其是近年來火爆的靶向治療和免疫治療,均高度依賴突變檢測的結(jié)果。因此突變檢測的靈敏度和準確性在癌癥的診療中十分關(guān)鍵。用二代測序手段進行全基因組級別的突變檢測一直被視為癌癥診療的“通用武器”,但市場上的現(xiàn)實狀況卻是亂象不止。不少人都有過體會,將同一份樣品送到兩家公司去進行檢測,得到的兩份突變檢測報告卻大相徑庭。事實上,這是一個國際性的難題。2017年,JAMA Oncology雜志發(fā)表研究,將40個患者的ctDNA樣品送至兩家國際知名的測序公司,大部分患者得到的兩份突變檢測報告中的突變完全不同。醫(yī)生很難從這樣兩份充滿著矛盾和沖突的報告中制定正確的治療方案,看似“先進”的二代測序技術(shù)卻往往帶來悲劇。在實驗和儀器早已高度標準化的情況下,主要的問題在于算法的準確性。使用標準樣品進行的室間質(zhì)評一直是監(jiān)管部門使用的質(zhì)控方法,但對基因組級別的檢測,標準樣品難以制備:人工方法做幾個突變出來還可以,但整個基因組的突變狀況要想給出可靠的標準答案非常難以做到。也因此,長期以來整個市場無法得到有效監(jiān)管。
2020年,華南理工大學(xué)杜紅麗教授團隊使用多個真實世界的測序數(shù)據(jù)集,制作了一系列基因組級別的低頻突變標準測試數(shù)據(jù)集,這是世界上第一個接近真實癌癥測序應(yīng)用場景、并有明確“標準答案”的突變檢測評測數(shù)據(jù)集,可以客觀真實地反映突變檢測流程的能力。此次研究中,研究者們利用這一系列標準測試數(shù)據(jù)集評測了5種突變檢測流程,包括唯一的純國產(chǎn)自主開發(fā)的FANSe流程和國際上的4種主流突變檢測算法。測試結(jié)果顯示,所有算法能檢出的突變基本99%以上都是正確的,即“假陽性”較少,但靈敏度則有巨大的差異。在所有場景下(突變頻率1-40%,測序深度100-800x),F(xiàn)ANSe的靈敏度都顯著超越其他所有算法,即FANSe能檢出更多的突變,同時保持很高的準確度。即便是1%突變率下,F(xiàn)ANSe也可以正確檢出87%的突變,而此時Mutect2和Strelka2僅能檢出20%左右的突變。突變率5%時,F(xiàn)ANSe即可幾乎完美地檢出所有的突變。速度方面更是一騎絕塵,無論是序列比對(mapping)過程還是突變檢測過程,均比其他流程快上數(shù)量級。
FANSe算法由承啟首席科學(xué)家張弓教授開發(fā),最初是專門用于大規(guī)模測序的序列比對,其準確度有數(shù)學(xué)證明,并已基本達到理論上限。隨后逐漸擴展其應(yīng)用領(lǐng)域,目前已直接整合了快速的突變檢測和表達量檢測等常用分析,部署于承啟生物的云平臺上。2020年,承啟生物云平臺創(chuàng)造了單機5分鐘分析完成一個人全基因組測序數(shù)據(jù)集的世界紀錄并保持至今,用戶不再需要自己購買昂貴的服務(wù)器,只需要上傳數(shù)據(jù)即可享受免費、快速準確的基因測序分析服務(wù)。2022年,以FANSe為基礎(chǔ)的大規(guī)模測序云分析系統(tǒng)在AWS上部署成功,全世界的用戶都可以在數(shù)據(jù)不出境的前提下使用FANSe快速準確的分析。FANSe極高的效率也使得其成為唯一一種在純國產(chǎn)CPU上能達到應(yīng)用上可接受的速度的分析流程,使得基因測序的全流程完全脫離國外技術(shù),徹底避免“卡脖子”,保障中國精準醫(yī)學(xué)的安全。
此次FANSe被確認可以準確全面地檢測癌癥突變,將為癌癥診療等應(yīng)用提供重要的標準化依據(jù),也為行業(yè)樹立了一個新的標桿。