[摘要]編碼氨基酸的密碼子具有簡(jiǎn)并性,而每種生物對(duì)同義密碼子的選擇都有自己偏好性。大腸桿菌作為一個(gè)原核表達(dá)系統(tǒng),經(jīng)常被用來(lái)表達(dá)外源蛋白,從大腸桿菌密碼子的使用,經(jīng)典蛋白的氨基酸組成,鄰近序列效應(yīng),相似終止密碼子等方面闡述大腸桿菌密碼子偏好情況,為實(shí)現(xiàn)外源蛋白在大腸桿菌中的高效表達(dá)提供參考數(shù)據(jù)。
[關(guān)鍵詞]大腸桿菌 密碼子偏好性 鄰近序列效應(yīng) 相似終止密碼子
中圖分類號(hào):Q50 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2009)0110003-01
目前生物醫(yī)藥研究和生物技術(shù)生產(chǎn)的主要方法是利用外源表達(dá)系統(tǒng)來(lái)表達(dá)目的蛋白,常用的外源表達(dá)系統(tǒng)有大腸桿菌表達(dá)系統(tǒng),酵母表達(dá)系統(tǒng),哺乳動(dòng)物表達(dá)系統(tǒng)等。要實(shí)現(xiàn)目的基因在外源表達(dá)系統(tǒng)中的成功表達(dá)和盡可能地提高其表達(dá)量,可以通過(guò)增加目的基因劑量,目的基因密碼子優(yōu)化,改善培養(yǎng)條件等方法實(shí)現(xiàn),其中目的基因密碼子優(yōu)化起到關(guān)鍵的作用。如果目的基因的密碼子與表達(dá)宿主不匹配,則會(huì)降低mRNA的翻譯效率和穩(wěn)定性,甚至?xí)斐蒻RNA翻譯的提前終止。[1]目前可以通過(guò)兩個(gè)途徑來(lái)解決這個(gè)問題:①提高宿主表達(dá)系統(tǒng)中底豐度的tRNA;②對(duì)目的基因進(jìn)行密碼子改造,使它的密碼子是宿主表達(dá)系統(tǒng)的高頻密碼子,也就是通常所說(shuō)的密碼子優(yōu)化。[2]
編碼氨基酸的密碼子一共有64個(gè),其中一個(gè)是起始密碼,兩個(gè)終止密碼,而氨基酸的種類有20種,所以說(shuō)氨基酸的密碼子存在簡(jiǎn)并性。真核生物和原核生物所偏好的密碼子不一樣,高效表達(dá)和低效表達(dá)在同義密碼的選擇上也有所不同,[3][4]甚至同一個(gè)基因的不同區(qū)域也存在這種現(xiàn)象[5],也就是說(shuō)不同生物根據(jù)情況對(duì)同義密碼的選擇有偏好性。高效表達(dá)的基因具有密碼子偏好性是因?yàn)閷?duì)翻譯效率和準(zhǔn)確性的要求更高,[6]同一個(gè)基因中保守序列比非保守序列對(duì)密碼子更具偏好性,分析其原因也是為了提高翻譯的準(zhǔn)確性。
在自然選擇過(guò)程中,對(duì)翻譯效率最大化的需要引起對(duì)同義密碼不同程度的選擇。蛋白的翻譯包括起始,延伸和終止三個(gè)過(guò)程,有證據(jù)證明蛋白合成過(guò)程中起始階段是蛋白質(zhì)合成效率的限制因素,[7]而蛋白合成的起始速率取決于核糖體和mRNA二者結(jié)合的速率,隨著mRNA濃度的提高可以有效地提高蛋白的合成速率,同時(shí)mRAN中含有高頻密碼子的翻譯效率高于低頻密碼子。最優(yōu)密碼子與高豐度的同功tRNA呈正相關(guān)的關(guān)系。
一、密碼子優(yōu)化的網(wǎng)站、軟件
密碼子優(yōu)化可以通過(guò)一些網(wǎng)站在線軟件來(lái)實(shí)現(xiàn),例如Gene Design[8]、Optimizer[9]、Synthetic Gene Designer [10]、Gene Dsigner[11]。
二、大腸桿菌密碼子使用和經(jīng)典蛋白的氨基酸組成
大腸桿菌表達(dá)系統(tǒng)被廣泛地應(yīng)用于外源蛋白的表達(dá),通過(guò)誘導(dǎo),目的蛋白的表達(dá)量可以達(dá)到總蛋白的60%-70%。[12]近年來(lái)有很多文章報(bào)道通過(guò)改造目的基因中稀有密碼子而變成大腸桿菌中高頻密碼子。從而大大地提高其表達(dá)量,如David.LAKEY等人通過(guò)改造85B抗原的5個(gè)稀有密碼子使表達(dá)量提高到原來(lái)的54倍。他們用Northen blotting分析發(fā)現(xiàn)目的基因的mRNA的量只增加1.7-2.5倍,所以說(shuō)表達(dá)量的提高是由于翻譯效率的提高。[13]因此如果需要在大腸桿菌中表達(dá)外源蛋白是需要考慮大腸桿菌中稀有密碼子和高頻密碼子使用情況。[14][15]另外,有文獻(xiàn)報(bào)道如果需要表達(dá)的目的蛋白的氨基酸組成不是大腸桿菌“典型”蛋白氨基酸組成,[16]那目的蛋白的表達(dá)量也會(huì)受到影響。
三、低頻密碼子子簇的影響
同義密碼子中的一些稀有密碼子簇會(huì)抑制目的蛋白的表達(dá)量或引起移碼突變。如AGG/AGA,AUA,CUA,CUA和CCC,[16][17]出現(xiàn)這種現(xiàn)象的原因是當(dāng)mRNA在翻譯的時(shí)候遇到稀有密碼子時(shí),翻譯復(fù)合物就會(huì)暫停下來(lái)等待Lys-tRANAuuu,于是在這個(gè)停頓的位點(diǎn)就會(huì)發(fā)生+1或是-1移碼突變。[19]當(dāng)通過(guò)共表達(dá)arg U(dnaY)基因時(shí),可以實(shí)現(xiàn)稀有密碼子簇的高效表達(dá)。[17]Rosenber[19]等構(gòu)建了一個(gè)稀有密碼子簇作用檢驗(yàn)系統(tǒng)。這個(gè)系統(tǒng)的基本原理是把目的基因和對(duì)照基因置于同一個(gè)啟動(dòng)子即T7啟動(dòng)子下,對(duì)照基因來(lái)自T7噬菌體的基因9。作者用這個(gè)系統(tǒng)檢測(cè)了一個(gè)具有312個(gè)氨基酸的蛋白。他們發(fā)現(xiàn)當(dāng)AGG在N端時(shí)對(duì)目的蛋白表達(dá)量的影響比在C端大,而且稀有密碼子簇的數(shù)量于對(duì)照基因的表達(dá)量呈負(fù)相關(guān)。即使目的蛋白中只含有單個(gè)的AGG/AGA稀有密碼子,也會(huì)引起翻譯問題,如在E.coli K-12中表達(dá)bovine placental lactogen(BPL),含有9個(gè)單個(gè)的AGG,BPL的蛋白表達(dá)量底于總蛋白的10%,[20]而且出現(xiàn)目的蛋白分子量不均一意想不到的結(jié)果。[21]進(jìn)一步研究發(fā)現(xiàn)是由于翻譯過(guò)程多肽鏈中6位的精氨酸和87位的leu異亮氨酸的錯(cuò)失。
四、鄰近序列效應(yīng),相似終止密碼子和錯(cuò)義翻譯
為了盡最大可能提高目的蛋白在大腸桿菌中的表達(dá)量,不僅要考慮將目的蛋白的稀有密碼子改造成大腸桿菌中的高頻密碼子,而且還要考慮同義密碼子的鄰近序列效應(yīng)(context effect),[22]OttoG.Bery和PedroJ.N. Silva [23]研究了大腸桿菌中具有2個(gè)簡(jiǎn)并密碼子的氨基酸鄰近6個(gè)堿基的影響,如谷氨酸的臨近序列是CCAGG,因?yàn)樵谶@個(gè)序列中如果發(fā)生突變更容易被修復(fù)系統(tǒng)所修復(fù)。[24]所以大腸桿菌內(nèi)密碼子如果以C/T為結(jié)尾,那它所偏好的臨近序列是密碼子后的第二位是G,而其中對(duì)NACNG的選擇大于NATNG。一些密碼子如果在特定的臨近序列內(nèi),這個(gè)序列會(huì)較為容易發(fā)生移碼突變,如編碼Phe的TTT在C或是T之前,編碼Lys的AAA在A或是G之前,所以對(duì)Phe的偏好密碼子是TTC而不是TTT,是為了盡可能地減少移碼突變。TTTN和AAAA/AAN應(yīng)該避免,尤其是高效表達(dá)的基因。而TTTR(Leu)和AAAY(Asn)會(huì)同時(shí)引起移碼突變和錯(cuò)誤翻譯,而且這個(gè)序列對(duì)合成持續(xù)性錯(cuò)誤敏感。 [23]
有些密碼子如(TAT)和大腸桿菌中終止密碼子(TAA)很相似,翻譯時(shí)特別是當(dāng)TAT在序列的+4位置時(shí)能夠被強(qiáng)烈地錯(cuò)認(rèn)為終止密碼子而使翻譯提前終止。[25]Precup等發(fā)現(xiàn)在大腸桿菌中TTC和TTT錯(cuò)誤翻譯概率很高,例如在argⅠ基因編碼區(qū)中,第3個(gè)和第8個(gè)密碼子分別是TTT和TTC,所編碼的氨基酸是Phe,而它們的鄰近序列分別是GTTTT和TTTCC,即使把第8個(gè)密碼子換成大腸桿菌中的同義高頻密碼子也不能降低其錯(cuò)誤翻譯的幾率。[26]在富含T的序列里(TTGT/TGTT),TGT(Cys)會(huì)被錯(cuò)誤地翻譯成Trp。[27]
在大腸桿菌表達(dá)系統(tǒng)中,無(wú)論是高、中、低偏好性的基因在前20個(gè)密碼子中都偏好以密碼子第三位是A而G是盡量避免的。[28]而高效表達(dá)的基因在前100150個(gè)密碼子中以G和C為密碼子的第三個(gè)堿基的比例逐漸上升。[29]
參考文獻(xiàn):
[1]Gustafsson,C.,et al.(2004) Trends Biotechnol.,22,346-353.
[2]Hernan,R.A., et al.(1992) Biochemistry, 31, 8619-8628.
[3]Coghlan, A., and K. H. Wolfe, 2000 16: 1131-1145.
[4]Akashi, H., 2003 164: 1291-1303.
[5]AKASHI, H., 1994. Genetics 136:927-935.
[6]Carlini, D. B.,2003. Genetics 163: 239-243.
[7]BUI.MERM, ., 1991 Genetics 129: 897-907.
[8]Richardson,S.M., (2006) Genome Res., 16,550-556.
[9]Pere Puigbo` 1, Eduard Guzma′ n1,2, et al,(2007) Nucleic Acids Research,Vol. 35, W126-W131.
[10]Wu,G., et al. (2006) Protein Expr. Purif., 47, 441-445.
[11]Villalobos,A., et al. (2006) BMC Bioinformatics, 7, 285.
[12]S. Jana . J. K. Deb,2005 Appl Microbiol Biotechnol67: 289-298.
[13]DAVID L. LAKEY, et al, 2000 INFECTION AND IMMUNITY, 0019-9567/00/$04.0010 Jan.p. 233-238.
[14]Saier MH Jr (1995) FEBS Lett 362:14.
[15]孫乃恩,et al.1990 《分子遺傳學(xué)》 南京大學(xué)出版社. 255.
[16]Wada K, et al.T: Nucleic Acid Res 1992, 20:2111-2118.
[17]Chen GFT, Inouye M (1994) Genes Dev 8:2641-2652.
[18]Lindsley D, Gallant J (1993)Proc Natl Acad Sci USA 90:5469-5473.
[19]Rosenberg AH, et al.1993 G: J Bacteriol, 175:716-722.
[20]Brinkmann U, et al. P: Gene 1989, 85:109-114.
[21]Kane JF, Violand BN, Curran DF, Staten NR, Duffin KL, Bogosian G: Nucleic Acids Res 1993, 20:6707-6712.
[22]Bulmer, M. (1990) Nucleic Acids Res., 18, 2869-2873.
[23]Otto G. Berg* et al.1997 Nucleic Acids Research, Vol. 25, No. 7 1397-1404.
[24]Lieb, M. and Bhagwat, A.S. (1996) Mol. Microbiol., 20,467-473.
[25]Pavlov,M.Y.,et al,1998 J.Mol.Biol.,284,579-590.
[26]Precup,J.Ulrich,et al 1989 Mol Gen. Gener.,218,397-401.
[27]Carrier,M.Jand Buckingham,R.H1984 J.Mol.Biol.,175,29-38.
[28]Andersson,S.G.E and Sharp,P.M 1996L.Mol.Evol.,42,525-536.
[29]Sean D.Hooper,Otto G.Berg 2000 Nucleic Acids Reseadrch,VOL.28,No.18 3517-3527.
作者簡(jiǎn)介:
鄭彬瓊,女,福建莆田,福建師范大學(xué)生命科學(xué)學(xué)院,研究方向:發(fā)育生物學(xué)。