深圳2022年3月21日 /美通社/ -- 近日,承啟生物發(fā)布由其首席科學(xué)家、暨南大學(xué)張弓教授團(tuán)隊(duì)研發(fā)的一種方便操作、超高精度蛋白質(zhì)全長(zhǎng)測(cè)序方案,準(zhǔn)確率可達(dá)99-100%,刷新了迄今為止的世界紀(jì)錄。該方案使得蛋白質(zhì)測(cè)序?qū)嵱没?,在生物學(xué)、醫(yī)學(xué)、生物安全、法醫(yī)物證等領(lǐng)域有廣闊的應(yīng)用前景。
蛋白質(zhì)是由20種氨基酸組成的長(zhǎng)鏈,是所有生命功能的實(shí)際執(zhí)行者。氨基酸序列決定著蛋白質(zhì)的功能,絕大多數(shù)疾病都是由于蛋白質(zhì)的異常而導(dǎo)致的。雖然絕大部分蛋白質(zhì)由基因轉(zhuǎn)錄翻譯而來(lái),但許多機(jī)制可以使蛋白質(zhì)序列在這個(gè)過(guò)程中發(fā)生變化,一個(gè)基因可以產(chǎn)生少則一兩種、多則幾萬(wàn)種不同的蛋白質(zhì),因此對(duì)蛋白質(zhì)的序列進(jìn)行直接研究就尤為重要。
蛋白質(zhì)測(cè)序的精準(zhǔn)化和實(shí)用化,在許多領(lǐng)域可以產(chǎn)生前所未有的應(yīng)用。例如,利用蛋白質(zhì)測(cè)序比核酸測(cè)序更快速、更不容易被污染干擾的特點(diǎn),癌癥、老年癡呆等重疾的早篩和診斷將變得更加快捷方便;遇到生物安全事件(如重大疫情)時(shí),蛋白質(zhì)測(cè)序能幾個(gè)小時(shí)內(nèi)快速鎖定病原體,大幅縮短疫情初期明確病原體的周期,為應(yīng)對(duì)疫情爭(zhēng)取寶貴時(shí)間;抗體藥物研發(fā)過(guò)程中對(duì)篩選出的優(yōu)秀抗體進(jìn)行直接測(cè)序,將可以很快通過(guò)合成生物學(xué)方法大量生產(chǎn)這種抗體,大大縮短抗體藥物的研發(fā)周期;蛋白質(zhì)測(cè)序技術(shù)也可以輕松破解被國(guó)外壟斷的蛋白質(zhì)制劑,大幅度降低藥品價(jià)格;測(cè)定從環(huán)境中分離到的具有優(yōu)異特性的蛋白質(zhì),如細(xì)菌真菌中降解各種污染物的酶,加以改造和工業(yè)應(yīng)用,可實(shí)現(xiàn)綠色環(huán)保低碳的發(fā)展目標(biāo)。
蛋白質(zhì)測(cè)序技術(shù)在1967年就已出現(xiàn),這比基因測(cè)序技術(shù)早了約10年,然而現(xiàn)在基因測(cè)序技術(shù)已高度成熟發(fā)達(dá),蛋白質(zhì)測(cè)序技術(shù)卻一直進(jìn)展緩慢,完整度低、精準(zhǔn)度低、成本高,導(dǎo)致蛋白質(zhì)測(cè)序一直沒(méi)有得到大范圍的應(yīng)用。這其中最大的區(qū)別在于,DNA可以準(zhǔn)確地進(jìn)行復(fù)制或互補(bǔ)配對(duì),幾乎所有基因測(cè)序技術(shù)都基于此,而蛋白質(zhì)無(wú)法復(fù)制,也無(wú)法依據(jù)序列來(lái)配對(duì)。
張弓教授團(tuán)隊(duì)在基因測(cè)序方面深耕多年,其全自主開(kāi)發(fā)的FANSe系列核酸測(cè)序算法是迄今為止穩(wěn)健性和準(zhǔn)確性最高的比對(duì)算法,同時(shí)具備很高的容錯(cuò)性。團(tuán)隊(duì)將基因組測(cè)序中的分步拼接和使用FANSe進(jìn)行高精度校正的思想移植到蛋白質(zhì)測(cè)序上,對(duì)蛋白質(zhì)質(zhì)譜分析進(jìn)行了策略改進(jìn),對(duì)同一樣品的多份質(zhì)譜數(shù)據(jù)進(jìn)行自我比對(duì)和校正,最終對(duì)蛋白質(zhì)全長(zhǎng)序列的測(cè)序準(zhǔn)確度達(dá)到了空前的99-100%,甚至可以發(fā)現(xiàn)買(mǎi)來(lái)的標(biāo)準(zhǔn)品蛋白中存在著突變。在不同結(jié)構(gòu)特性的多個(gè)蛋白質(zhì)的測(cè)試中,一律能達(dá)到近乎完美的全長(zhǎng)測(cè)序結(jié)果,除非質(zhì)譜儀測(cè)不出原始數(shù)據(jù)。更令人欣喜的是,這個(gè)策略甚至能應(yīng)對(duì)質(zhì)量較差的、有污染的實(shí)驗(yàn)數(shù)據(jù),同樣能穩(wěn)健地輸出準(zhǔn)確的結(jié)果。實(shí)驗(yàn)操作簡(jiǎn)便,算法也大部分可自動(dòng)化運(yùn)行,因此這種方法成本低、速度快、易于推廣。
正如基因測(cè)序精準(zhǔn)化、廉價(jià)化之后引發(fā)人類(lèi)生活和產(chǎn)業(yè)的巨變一樣,蛋白質(zhì)測(cè)序精準(zhǔn)化、廉價(jià)化,將又一次給人類(lèi)社會(huì)帶來(lái)巨變。
目前,這一蛋白質(zhì)測(cè)序方法的論文已在分析化學(xué)的權(quán)威期刊Analytical Chemistry上發(fā)表,算法可在承啟生物網(wǎng)站上免費(fèi)下載:http://chi-biotech.com/mucs/
參考資料:Highly Robust de Novo Full-Length Protein Sequencing, Anal. Chem. 2022, 94, 8, 3467–3475 |