北京2024年9月12日 /美通社/ -- 載體構(gòu)建是蛋白表達(dá)等很多實驗的起點,也許你知道可以通過優(yōu)化啟動子、調(diào)整表達(dá)載體、選擇合適的宿主細(xì)胞、控制培養(yǎng)條件等來提高蛋白表達(dá)量,但你是否關(guān)注過密碼子優(yōu)化這個關(guān)鍵步驟呢?當(dāng)遇到片段擴(kuò)增失敗,或載體難構(gòu)建的情況,也許你會不停優(yōu)化引物設(shè)計、或更換試劑,你是否知道可以通過序列優(yōu)化增加載體構(gòu)建成功率呢?
在理解密碼子優(yōu)化的重要性之前,需先了解密碼子在基因表達(dá)中的作用。DNA序列通過轉(zhuǎn)錄和翻譯產(chǎn)生蛋白質(zhì),而每個密碼子由三個核苷酸組成,指定一個特定的氨基酸。這種對應(yīng)關(guān)系在密碼子表中明確列出,例如,密碼子"ATG"編碼甲硫氨酸(Met),開始蛋白質(zhì)的合成。苯丙氨酸(Phe)對應(yīng)的密碼子有UUU和UUC,而終止密碼子包括UAA、UAG和UGA。這種精確的編碼方式確保了蛋白質(zhì)合成的準(zhǔn)確性和特異性?。
雖然不同的密碼子可編碼相同的氨基酸,但不同生物體對密碼子的使用存在偏好。這種偏好與每個生物體內(nèi)特定tRNA的豐度相關(guān)。基因表達(dá)水平與密碼子偏好性之間存在強(qiáng)相關(guān)性,同一氨基酸在不同宿主中,其對應(yīng)的密碼子會表現(xiàn)出不同程度的偏好[1]。因此,直接使用未優(yōu)化的基因序列可能導(dǎo)致外源基因在宿主,特別是異源宿主中的表達(dá)效率低下。
密碼子優(yōu)化(codon optimization)是在不改變基因編碼蛋白質(zhì)的前提下,通過調(diào)整基因編碼序列中的密碼子使用頻率,使用物種偏好密碼子并避免稀有密碼子得到優(yōu)化序列,來提高外源基因在宿主細(xì)胞中表達(dá)水平的技術(shù)[2]。
對于自己構(gòu)建載體的客戶來說,是無法進(jìn)行密碼子優(yōu)化的,因此采用基因合成方法來構(gòu)建載體就成為了首選。
序列優(yōu)化涉及更廣泛的序列調(diào)整,包括優(yōu)化GC含量、避免重復(fù)序列、消除不利的mRNA二級結(jié)構(gòu)等,目的是提高整個基因的穩(wěn)定性和表達(dá)效率,同時不改變最終編碼的氨基酸序列。
(1)密碼子偏好性
密碼子適應(yīng)指數(shù)CAI是指異源mRNA序列中密碼子和宿主細(xì)胞最佳密碼子使用頻率相符合的程度,理論上此值越接近1,外源mRNA在宿主細(xì)胞中的蛋白表達(dá)越高,通常CAI<0.8時,被認(rèn)為需要進(jìn)行密碼子優(yōu)化。使用宿主細(xì)胞中使用頻率高的同義密碼子替換外源mRNA序列中的密碼子,例如,在大腸桿菌中,某些密碼子如TAA和TAG可能很少使用,而GCA(編碼丙氨酸)的使用頻率較高。且避免出現(xiàn)稀有密碼子,稀有密碼子可能導(dǎo)致翻譯停頓,增加翻譯時的錯誤率,從而降低蛋白質(zhì)產(chǎn)量。同時考慮高頻和次高頻的密碼子組合。
注意CAI值過高可能導(dǎo)致外源基因在宿主細(xì)胞中過度表達(dá),進(jìn)而使得蛋白質(zhì)在合成過程中積累過快,無法正確折疊,從而形成包涵體。包涵體是指在細(xì)胞內(nèi)形成的不溶性蛋白質(zhì)聚集物,通常是因為蛋白質(zhì)未能正確折疊或是由于蛋白質(zhì)表達(dá)水平過高。適當(dāng)?shù)拿艽a子優(yōu)化可以幫助調(diào)控蛋白質(zhì)的表達(dá)速率,減少包涵體的形成,提高目標(biāo)蛋白的正確折疊和可溶性表達(dá)。
(2)GC含量
理想的GC含量通常在40%-60%之間。過高的GC含量可能導(dǎo)致mRNA二級結(jié)構(gòu)過于穩(wěn)定,過低則可能影響轉(zhuǎn)錄效率。
(3)mRNA二級結(jié)構(gòu)
復(fù)雜和穩(wěn)定的二級結(jié)構(gòu)會影響翻譯效率,特別是序列中有和核糖體結(jié)合位點或翻譯起始位點互作的序列,會阻止翻譯的進(jìn)行,合理優(yōu)化翻譯起始區(qū)的mRNA二級結(jié)構(gòu),可提高蛋白表達(dá)水平。
擎科生物獨(dú)有的 GeneOptimizer 軟件密碼子優(yōu)化算法是不僅局限于密碼子層面的序列深度優(yōu)化技術(shù)。支持上萬種宿主優(yōu)化和定制化服務(wù)。優(yōu)化的主要參數(shù)包括:密碼子偏好性、GC 含量、減少poly(A) 結(jié)構(gòu)、重復(fù)序列、核糖體結(jié)合位點、酶切位點等。在保證密碼子適應(yīng)指數(shù)CAI和GC含量處在合理范圍內(nèi),盡可能減少其他負(fù)面因素的影響,求得帕累托最優(yōu)解,進(jìn)而完成對基因表達(dá)的優(yōu)化。擎科生物可為基因合成客戶提供免費(fèi)的密碼子及序列優(yōu)化服務(wù)。
通過自動化序列分析評估軟件在不到一次眨眼的時間就能完成一個準(zhǔn)確的序列優(yōu)化(0.1s/個)。
擎科生物自主開發(fā)的自動化方案設(shè)計軟件,根據(jù)載體和序列特點可批量設(shè)計多種高效構(gòu)建方案,提高載體構(gòu)建成功率。
案例分享:
(1)目標(biāo)蛋白16.8 kDa,密碼子優(yōu)化前蛋白不表達(dá),密碼子優(yōu)化后蛋白大量表達(dá)。
(2)目標(biāo)蛋白100 kDa,密碼子優(yōu)化前包涵體表達(dá),密碼子優(yōu)化后上清可溶表達(dá)75%。
[1] Sharp, P. M., & Li, W. H. (1987). "The Codon Adaptation Index—a measure of directional synonymous codon usage bias, and its potential applications." Nucleic Acids Research, 15(3), 1281-1295.
[2] Gustafsson, C., Govindarajan, S., & Minshull, J. (2004). "Codon bias and heterologous protein expression." Trends in Biotechnology, 22(7), 346-353.