蔡海鶯,李楊 ,張輝,馮鳳琴
1 浙江大學食品科學與營養(yǎng)系,浙江 杭州 310058
2 浙江大學馥莉食品研究院,浙江 杭州 310058
隨著現(xiàn)代基因工程和生物工程理論和技術(shù)的高速發(fā)展,無論是基礎(chǔ)研究領(lǐng)域,還是生物醫(yī)藥、農(nóng)業(yè)、環(huán)保和食品等應(yīng)用領(lǐng)域,利用異源表達系統(tǒng)生產(chǎn)更高水平的目的重組蛋白都已成為研究熱點和重點。相對于原始基因在自身宿主的表達,利用異源宿主表達重組蛋白具有許多優(yōu)點:首先,異源表達可能顯著提高目的蛋白的表達量[1];其次,異源表達中通常所選的宿主具有相對透徹的研究背景,以及成熟的發(fā)酵和分離純化工藝,有利于提高生產(chǎn)效率、節(jié)約成本;另外,異源表達中通常所選的宿主具有生物安全性,在食品和醫(yī)藥方面,有利于避免使用病原宿主而引發(fā)的潛在風險[2]。
1977年,Genentech公司的Itakura等[3]首次完成基因的異源表達,將化學合成的人體蛋白生長抑素基因以和 β-半乳糖苷酶基因融合的形式在原核生物大腸桿菌E. coli中表達,并得到具有功能活性的生長抑素。隨著生物技術(shù)不斷發(fā)展,絕大多數(shù)的基因都能通過PCR (Polymerase chain reaction) 和 RT-PCR (Reverse transcription -Polymerase chain reaction) 等核酸擴增技術(shù)得到,但是基因合成并不能被完全替代。人們把PCR擴增技術(shù)獲得的完整基因克隆到表達載體并轉(zhuǎn)化到表達宿主后發(fā)現(xiàn),克隆的基因經(jīng)常不能表達出重組蛋白,或僅僅表達出很低水平的重組蛋白。研究人員通過各種手段一定程度地緩解了這一問題,如提高宿主的分泌能力,使用蛋白酶缺陷的宿主,提高基因的拷貝數(shù),采用強的啟動子,融合表達,共表達分子伴侶等。但是這些手段都忽略一個潛在但又非常重要的問題,采用PCR擴增的編碼蛋白基因在不同的生物體內(nèi)對應(yīng)的DNA序列可能差異巨大。而這些編碼重組蛋白的核酸序列在其他生物體內(nèi)表達時,可能在轉(zhuǎn)錄、翻譯等不同表達水平受到各種因素的限制。因此,從不同角度對基因序列進行優(yōu)化或者重新根據(jù)蛋白序列進行基因設(shè)計以提高蛋白重組表達的效率逐漸成為現(xiàn)代生物技術(shù)的研究熱點之一。但目前基因設(shè)計和優(yōu)化理論尚不完善,各種優(yōu)化效果參差不齊,本文根據(jù)現(xiàn)有報道,系統(tǒng)綜述了基因設(shè)計對重組蛋白表達影響的研究進展。
不同物種的基因在密碼子使用上存在著明顯的偏好性,甚至同物種內(nèi)不同功能的基因其密碼子使用頻率也存在較大的差異,密碼子偏愛性對重組蛋白的異源表達具有深刻復雜的影響[4]。在原核生物內(nèi),密碼子使用頻率已經(jīng)被鑒定為影響翻譯的基因序列元件中重要的要素[5]。密碼子偏愛性在真核生物內(nèi)同樣是影響蛋白表達水平的關(guān)鍵因素之一。目前,密碼子偏愛性影響蛋白表達的主要機制已基本確定,生物體偏愛的密碼子與體內(nèi)對應(yīng)的 tRNA的豐度基本呈正相關(guān),而tRNA的豐度決定在蛋白翻譯延伸的過程中可用的氨基酸數(shù)量,從而影響了蛋白合成的效率[6]。
一方面異源表達系統(tǒng)具有自己的獨特優(yōu)勢,另一方面,由于不同生物的密碼子偏愛性存在差異,異源表達可能原始編碼重組蛋白的基因從偏愛的密碼子變成影響翻譯的稀有密碼子。如何降低這一風險已成為異源表達系統(tǒng)的重要步驟之一。
1.2.1 改造宿主
既然已知 tRNA的缺乏可能導致對應(yīng)的稀有密碼子在蛋白表達過程中使翻譯速率降低甚至終止,從而使蛋白水平顯著降低,研究者為了避免蛋白表達在翻譯環(huán)節(jié)受到限制,應(yīng)用了一種在宿主體內(nèi) (通常是細菌) 通過質(zhì)粒補充稀有密碼子對應(yīng)的 tRNA的策略進行蛋白表達的優(yōu)化[7]。這種方法在E. coli中應(yīng)用非常成功(例如pRARE2),許多外源蛋白在E. coli中表達量都顯著提高[8]。同時,在異源宿主中共表達特殊的tRNA能在一定程度上修飾宿主的密碼子偏愛性效應(yīng)并提高目的蛋白的表達量的現(xiàn)象,也間接證明密碼子偏愛性是通過控制可用的tRNA豐度影響蛋白的翻譯過程。該方法已被廣泛用作密碼子優(yōu)化提高蛋白表達的策略之一。
1.2.2 稀有密碼子替換
為了使外源基因在異源表達系統(tǒng)內(nèi)有效表達,通過優(yōu)化基因的密碼子是十分有效的方法。擁有所用宿主的稀有密碼子越多的基因,越難在該宿主中表達出理想水平的重組蛋白,另外,如果稀有密碼子出現(xiàn)在靠近蛋白的 N-端部分,或者以成串形式出現(xiàn),則蛋白的翻譯速率將進一步降低[9]。密碼子優(yōu)化策略有幾種,一種是選用高頻使用的密碼子替代基因中存在的已選宿主的稀有密碼子[10]??梢酝ㄟ^定點突變的方法逐步把原始基因改成預期的基因序列,能有效地降低成本。另外,這種方法的優(yōu)點還包括不需要對基因轉(zhuǎn)錄后的 mRNA序列作出較大改動,假設(shè)原始基因的mRNA在進化過程中已經(jīng)具有比較合理的結(jié)構(gòu),那么這種方法能降低由于mRNA大幅度改變帶來的不良影響。另一種方法是在排除原始基因中的稀有密碼子的基礎(chǔ)上進行重新合成,同時使密碼子組成頻率更接近宿主[11]。這種方法除了能對密碼子進行修飾,還能根據(jù)研究者需要對基因序列進行其他方面的優(yōu)化,包括限制性酶切位點改造、mRNA穩(wěn)定性優(yōu)化等。
1.2.3 異源表達宿主的選擇或同源表達
密碼子的偏愛性與物種的親緣關(guān)系有一定的相關(guān)性,親緣關(guān)系近的物種具有相對類似的密碼子偏愛性,為了降低密碼子偏愛性對蛋白表達影響的風險,較為簡單的方法是在與基因宿主有類似密碼子偏愛性的異源表達宿主中表達這一基因。
利用同源表達 (Homologous expression)技術(shù)發(fā)掘生物體自身的蛋白,尤其是酶資源,受到越來越多的關(guān)注。同源表達技術(shù)可以用來表達在其他異源表達系統(tǒng)中難以表達的蛋白,顯著提高該蛋白的產(chǎn)量。Mayfield等[12]在黃孢原毛平革菌Phanerochaete chrysosporium中成功表達了啟動子改造后的自身蛋白錳過氧化氫酶基因。Jia等[13]在洋蔥伯克霍爾德氏菌Burkholderiacepacia通過同源表達的方式過量表達了該菌株自身的脂肪酶基因。同源表達與異源表達相比,具有以下幾方面的優(yōu)點:1) 基因來源于自身,表達菌株并不是嚴格意義上的轉(zhuǎn)基因,在應(yīng)用領(lǐng)域 (尤其是食品) 更容易推廣;2) 表達的蛋白與宿主有更好的相容性,更有可能獲得較高的表達水平;3) 需要較少的基因修飾,如密碼子和密碼子環(huán)境方面的修飾等。
隨著對蛋白表達研究的不斷深入,研究人員發(fā)現(xiàn)即使宿主中高表達的基因中也存在一定的稀有密碼子。這引發(fā)了人們對密碼子和蛋白表達關(guān)系的新思考。由于核糖體對 mRNA不同區(qū)域的翻譯速率存在差異,并且蛋白質(zhì)在核糖體能夠進行翻譯時折疊,Thanaraj等提出假設(shè),翻譯動力學可能影響新生肽鏈的折疊過程。他們進一步研究發(fā)現(xiàn),高級結(jié)構(gòu)或結(jié)構(gòu)域之間的連接區(qū)域和蛋白域邊界 (Protein domain boundary) 通常由RNA上翻譯緩慢的區(qū)域編碼 (圖 1),同時組成這部分區(qū)域的氨基酸也大多是能夠通過與核糖體的新生肽鏈通道發(fā)生粘連作用而減緩翻譯速率的[14-15]。因此,蛋白合成與蛋白的體內(nèi)折疊并不是獨立的兩個過程,而是有著非常密切的相關(guān)性。另外,Komar等[16]通過體外翻譯實驗證明同義密碼子之間的更換并不是嚴格的沉默突變,它能夠影響蛋白質(zhì)翻譯延伸的速率,從而導致蛋白質(zhì)折疊和功能發(fā)生變化。這表明基因核苷酸序列也一定程度上決定了重組蛋白的結(jié)構(gòu)和功能。上述研究表明,密碼子的優(yōu)化必須與蛋白的高級結(jié)構(gòu)聯(lián)系起來,如果通過一味地替換稀有密碼子來提高重組蛋白的表達可能會起到適得其反的結(jié)果。目前仍有很多蛋白不能通過密碼子優(yōu)化來實現(xiàn)高效表達也可能是欠缺這方面的考慮。
圖1 新生肽鏈翻譯的不連續(xù)性與翻譯時折疊相關(guān)[15]Fig. 1 Local discontinuous translation actively coordinates co-translational folding of the nascent chain[15].
既然連接蛋白高級結(jié)構(gòu)元件的域邊界區(qū)能夠偏好地使用一系列特定的氨基酸,同時采用稀有的密碼子編碼這些氨基酸來幫助蛋白的合理折疊,Angov等[17]提出了一種被稱為密碼子協(xié)調(diào)化 (Codon harmonization) 的密碼子優(yōu)化規(guī)則,將基因在原始宿主內(nèi)通過編碼蛋白域邊界密碼子的選擇,間接調(diào)控蛋白折疊的機制復制到需要異源表達的宿主。密碼子協(xié)調(diào)化首先需要通過密碼子使用頻率和蛋白的二級結(jié)構(gòu)來確定mRNA的慢速翻譯區(qū)域,即編碼蛋白結(jié)構(gòu)元件的連接或終止區(qū)域;然后通過同義密碼子替換使結(jié)構(gòu)基因在新的宿主中每個位置的密碼子使用頻率與原始宿主的盡量相符。
這種優(yōu)化方法對于提高重組蛋白的異源表達已被多次證明十分有效。由于惡性瘧原蟲Plasmodium falciparum結(jié)構(gòu)基因 AT含量高達80%[18],因此利用E. coli異源系統(tǒng)高效表達這類基因編碼的蛋白異常艱難。Darko等[19]利用密碼子協(xié)調(diào)化的優(yōu)化方法,分別獲得了編碼惡性瘧原蟲菌株 FVO的主裂殖子表面蛋白 1 (Merozoite surface protein,MSP1) 的 C端部分 42 kDa的蛋白片段 MSP142(FVO) 基因的兩種優(yōu)化基因FMP003和LSA-NRCH,分別對應(yīng)在預測的蛋白域連接區(qū)域改變了一個密碼子和對全序列的密碼子協(xié)調(diào)化優(yōu)化,兩種基因都成功實現(xiàn)了惡性瘧原蟲 MSP142(FVO) 蛋白片段的可溶性表達。Angov等[17]在Darko等研究的基礎(chǔ)上,系統(tǒng)比較了 3種惡性瘧原蟲疫苗候選蛋白 MSP142(FVO)、MSP142 (3D7) 和 MSP142 (Camp) 的原始基因和密碼子協(xié)調(diào)化優(yōu)化基因在E. coli的表達情況,結(jié)果表明通過優(yōu)化的基因序列都能顯著提高蛋白的表達量和可溶性,對應(yīng)的蛋白表達水平提高了4~1 000倍不等。另外,他們還比較了對編碼 MSP142 (FVO)的基因分別采取不同的優(yōu)化方法的優(yōu)化效果,結(jié)果顯示密碼子協(xié)調(diào)化獲得的序列LSA-NRCH在E. coli的表達量明顯高于對應(yīng)的替換所有稀有密碼子的優(yōu)化方法獲得的序列 LSA-NRCE。Chowdhury等[20]通過密碼子協(xié)調(diào)化的優(yōu)化方法成功地在E. coli表達系統(tǒng)中高效表達了惡性瘧原蟲蛋白Pfs48/45,而且獲得的重組蛋白 CH-rPfs48/45能夠被對應(yīng)的天然蛋白的抗原決定簇的單克隆抗體識別。
因此,密碼子協(xié)調(diào)化是現(xiàn)有密碼子優(yōu)化策略的一個重要補充,有望幫助目前難以在異源表達系統(tǒng)中重組表達的蛋白實現(xiàn)高效表達,尤其是需要可溶性、功能性表達的蛋白。
除了密碼子使用頻率的非隨機性外,越來越多的證據(jù)表明密碼子環(huán)境 (Codon context)也影響密碼子與反義密碼子之間的識別,從而影響翻譯延伸的速率。最早的證據(jù)來源于對無義突變密碼子的研究,研究者發(fā)現(xiàn)無義突變抑制子 (Suppressor) 對無義密碼子的抑制效率明顯地受到附近核苷酸的影響[21]。同樣的現(xiàn)象也發(fā)生在抑制子對錯義突變包括移碼突變的抑制[22-23]。顯然,機體抑制子對無義密碼子的抑制活性受密碼子環(huán)境影響表明終止密碼子的翻譯終止同樣是環(huán)境依賴性的。另外,對大腸桿菌蛋白的編碼序列的統(tǒng)計分析顯示,密碼子對(Codon pair) 同樣具有很高的偏愛性。實際統(tǒng)計得到的3 721 (612) 種密碼子對與以61種密碼子使用頻率計算得到的對應(yīng)密碼子對的隨機期望值 (Random expectation) 相比,部分密碼子對的實際出現(xiàn)頻率高于預測值,稱為被過度代表的 (Overrepresented);部分密碼子對的實際出現(xiàn)頻率低于預測值,稱為代表不足的(Underrepresented)[24-27]。越來越多的實驗表明位于翻譯核糖體表面的 A和 P位點相鄰的氨酰tRNA之間的相容性,可能是引起翻譯過程中密碼子環(huán)境效應(yīng)的原因[28]。這種相容性可能通過改變翻譯速率,從而成為調(diào)節(jié)蛋白表達的重要因子之一。
進一步的統(tǒng)計分析證明了這個結(jié)論,在大腸桿菌基因組內(nèi),密碼子對利用模式與基因的表達水平存在相關(guān)性,相對于低水平表達的基因,編碼高水平表達的蛋白基因,傾向于包含較多高頻出現(xiàn)但代表不足的密碼子對。其中,高頻的密碼子對可能保證了基因使用的是高頻的密碼子,從而有利于基因的翻譯表達[24-25]。和密碼子偏愛性類似,不同生物的密碼子對使用頻率之間也有明顯差異,具有各自的密碼子對偏愛性 (Codon pair bias)[27-29],因此,編碼重組蛋白的目的基因需要在外源的表達系統(tǒng)中表達時,密碼子對偏愛性可能是影響蛋白重組表達的重要因素之一。
如果需要在大腸桿菌中高效重組表達某一外源基因,對密碼子對進行優(yōu)化可能是不可或缺的一環(huán)。Hatfield等[30]利用密碼子對偏愛性,發(fā)明了一種新型的基因設(shè)計優(yōu)化方法 CODA(Computationally optimized DNA assembly)。在E. coli中對編碼釀酒酵母Ty3反轉(zhuǎn)座子GAG基因的衣殼部分片段進行優(yōu)化表達的結(jié)果顯示,相對于原始基因在E. coli中的表達,盡管優(yōu)化該基因片段的密碼子使用頻率 (密碼子優(yōu)化)的方法能顯著提高目的蛋白的表達水平,但是在密碼子優(yōu)化基礎(chǔ)上進行密碼子對偏愛性的優(yōu)化,既避免過度代表密碼子對的出現(xiàn)的優(yōu)化方法,還能使蛋白表達在密碼子優(yōu)化的水平上獲得進一步的提高。
同樣地,利用密碼子對偏愛性,科學家還設(shè)計了有目的地使蛋白表達顯著降低的應(yīng)用系統(tǒng)。接種減毒活疫苗是用來預防病毒、細菌和原蟲等病原引起的流行性疾病的常用策略之一。Coleman等[31]通過合成性減毒病毒工程(Synthetic attenuated virus engineering,SAVE)的方法,重新設(shè)計合成了經(jīng)過密碼子對同義替換處理的編碼脊髓灰質(zhì)炎病毒衣殼蛋白的DNA大分子。在保證其他影響翻譯的因素 (如密碼子使用頻率、RNA二級結(jié)構(gòu)等) 不變的情況下,在接種的小鼠中提高代表不足的密碼子對同義替換的基因設(shè)計引起對應(yīng)病毒衣殼蛋白的翻譯速率明顯下降,從而導致包含該氨基酸依賴變化的脊髓灰質(zhì)炎病毒毒性減弱;反之,提高過度代表的密碼子對的基因設(shè)計則提高了對應(yīng)病毒衣殼蛋白的翻譯水平。令人意外的是,這種結(jié)果與前期研究者在E. coli系統(tǒng)中獲得的結(jié)論,即代表不足的密碼子對有利于蛋白的翻譯剛好相反。隨后,Muller等[32]利用SAVE方法通過全基因組范圍的密碼子對替換,對流感病毒株A/PR/8/34進行病毒毒性減弱的理性設(shè)計。與Coleman等的結(jié)果類似,相對于野生型的流感病毒,通過使用代表不足的密碼子對替換設(shè)計的病毒在小鼠中的毒性顯著減弱。上述結(jié)果可能暗示在哺乳動物小鼠體內(nèi)密碼子偏愛性對蛋白表達的作用模式與原核生物E. coli的模式非常不同。這可能跟密碼子環(huán)境保守性有關(guān),高等真核生物相比其他種類生物只有較低的密碼子環(huán)境保守性[27]。但是,這并不能解釋接下來的實驗結(jié)果。Coleman等[33]還通過密碼子對替換的基因設(shè)計對肺炎鏈球菌Streptococcus pneumoniae進行毒性減弱,他們在保證氨基酸序列不變的基礎(chǔ)上盡量使用代表不足的密碼子對重新編碼S. pneumoniae的血清 3型 (SP3) 的溶血素(Pneumolysin,ply) 基因。與野生型或者ply缺失的ΔplySP3菌種相比,密碼子對改造菌種的溶血素蛋白表達量明顯降低,并且對小鼠的毒性以及在肺中引起的炎癥反應(yīng)都顯著性下降。這表明同樣屬于原核生物的S. pneumoniae和E. coli,密碼子對對于蛋白表達的作用模式也非常不同。
綜上所述,密碼子對偏愛性與蛋白表達存在明顯的相關(guān)性,因此,通過對密碼子對偏愛性進行優(yōu)化是提高異源表達重組蛋白的重要環(huán)節(jié)之一。然而,不同生物體內(nèi),由于密碼子對偏愛性對蛋白翻譯過程的作用模式可能不同,相關(guān)的作用機理也比較模糊,因此,應(yīng)針對不同的生物自身特點來進行密碼子對偏愛性的優(yōu)化。
與密碼子協(xié)調(diào)化理論對應(yīng),研究發(fā)現(xiàn)高級結(jié)構(gòu)或結(jié)構(gòu)域之間的連接區(qū)域和蛋白域邊界往往由RNA上翻譯緩慢的區(qū)域編碼,因此編碼組成這部分區(qū)域的氨基酸序列也經(jīng)常存在能夠使翻譯速率降低的密碼子對。經(jīng)統(tǒng)計計算分析,編碼人免疫缺陷病毒衣殼蛋白和釀酒酵母 Ty3反轉(zhuǎn)座子 GAG的衣殼部分片段的基因序列在蛋白邊界區(qū)都不同程度地存在過度代表的密碼子對[30],這些密碼子對被認為在翻譯過程中,通過降低翻譯速率而有意暫停,來保證有足夠的時間來完成新生肽鏈的高級結(jié)構(gòu)和結(jié)構(gòu)域的折疊。
Trinh等[34]在保證密碼子使用頻率在哺乳動物細胞中相對穩(wěn)定的情況下,通過對抗Her2/Neu單鏈抗體 (Single chain variable region fragment,ScFv) 中連接重鏈可變區(qū) (VH) 和輕鏈可變區(qū) (VL) 之間的接頭,以及單鏈抗體與人抗鼠鐵傳遞蛋白受體 IgG3重鏈 CH3的接頭(GGGGS)3兩處編碼序列進行密碼子對優(yōu)化,并轉(zhuǎn)染大鼠細胞進行表達,結(jié)果顯示,優(yōu)化序列中單個核苷酸的改變使得該融合蛋白表達提高30倍以上,并且通過對mRNA定量分析證實蛋白表達量的提高完全由翻譯效率提高實現(xiàn)。然而,與實驗預期相反的是,密碼子對的優(yōu)化是將過度代表的密碼子對換成代表過少的密碼子對,而前期的研究表明代表過少的密碼子對在E. coli中是有利于翻譯的,但作為蛋白域邊界的接頭需要翻譯有意的暫停來幫助蛋白高級結(jié)構(gòu)的折疊。因此,Trinh等認為對于該實驗表達的融合蛋白可能在接頭處不需要翻譯暫停太長時間。然而,根據(jù)Coleman等和Muller等的研究結(jié)果,這種解釋可能并不妥當,而可能是由于不同生物中,密碼子對作用于蛋白翻譯的模式并不相同,與E. coli相反,在哺乳動物中,過度代表的密碼子對有利于蛋白的翻譯。如果這一結(jié)論成立的話,則能與密碼子協(xié)調(diào)化的結(jié)論相呼應(yīng),即高級結(jié)構(gòu)或結(jié)構(gòu)域之間的連接區(qū)域和蛋白域邊界需要一些降低翻譯的因素,如稀有密碼子、密碼子對等,以便提供蛋白的高級結(jié)構(gòu)或結(jié)構(gòu)域在翻譯時充分正確地折疊。但是,由于相關(guān)的研究還較少,這一假設(shè)還需要進一步驗證。
研究表明,基因GC含量是基因設(shè)計和優(yōu)化的重要指標[35],不同物種間基因組的 GC含量有顯著差異,在宿主中表達某些其他來源的基因時很容易引起人們的注意。GC含量通常間接對基因表達進行調(diào)控和影響。
蛋白的表達調(diào)控分為轉(zhuǎn)錄水平和翻譯水平,一般來說,轉(zhuǎn)錄水平起關(guān)鍵作用,但是同時,翻譯的效率與mRNA的降解直接相關(guān),因此,也間接影響著轉(zhuǎn)錄后水平的調(diào)控。如原核生物中,存在稀有密碼子的mRNA由于翻譯延伸過程受到影響,使得mRNA得不到更多核糖體結(jié)合后的有效保護,也將導致mRNA的降解從而使積累水平顯著降低,蛋白表達已被多次證明與 mRNA穩(wěn)定性相關(guān)[36-37]。但是對于mRNA穩(wěn)定性的優(yōu)化比較困難,缺乏比較成熟的理論體系,相反,過高的mRNA穩(wěn)定性意味著過高的 GC含量及穩(wěn)定的二級結(jié)構(gòu)等不利于蛋白翻譯的因素。
研究顯示核糖體僅僅能夠與單鏈RNA結(jié)合并起始翻譯[38],另外,較大的折疊自由能可能減緩核糖體的延伸從而降低翻譯效率[39]。因此,mRNA如果形成大而穩(wěn)定的二級結(jié)構(gòu)如發(fā)卡結(jié)構(gòu)和莖環(huán)結(jié)構(gòu),尤其是起始密碼子附近的穩(wěn)定二級結(jié)構(gòu),將會影響mRNA在翻譯過程中核糖體的結(jié)合和延伸,從而降低翻譯的效率和最終的蛋白表達水平[39-41]。
Kudla等[42]構(gòu)建了包含 154種不同隨機密碼子同義突變的GFP蛋白突變體庫,通過對其在大腸桿菌中的蛋白表達水平,研究mRNA折疊自由能對翻譯效率的影響。結(jié)果表明,在排除密碼子偏愛性因素后,GFP蛋白表達豐度與轉(zhuǎn)錄的mRNA的前40個核苷酸片段的折疊自由能顯著相關(guān)。Tuller等[39]通過對大腸桿菌和釀酒酵母轉(zhuǎn)錄組的研究發(fā)現(xiàn),mRNA的前40核苷酸片段的平均自由能明顯小于下游長度為40的核苷酸片段的平均自由能,表明生物在進化過程中可能要求更有效的翻譯起始,從而驅(qū)使mRNA起始密碼子附近二級結(jié)構(gòu)穩(wěn)定性降低。這種進化選擇性在其他物種中同樣存在[43]。另外,Tuller等[39]還發(fā)現(xiàn)mRNA的41~80核苷酸的平均自由能明顯大于其他長度為 40的核苷酸片段的平均自由能,這可能是生物體通過這段核苷酸片段形成自身的穩(wěn)定結(jié)構(gòu),防止其與核糖體結(jié)合位點的核苷酸序列形成潛在的有害結(jié)構(gòu)的一種保護翻譯有效起始的策略。Desmit等[44]通過對噬菌體MS2的外殼蛋白基因的同義密碼子突變體在大腸桿菌中的表達,定量分析了翻譯起始區(qū)的mRNA二級結(jié)構(gòu)與翻譯效率的關(guān)系,結(jié)果表明翻譯起始區(qū) mRNA折疊自由能每增大1.4 kcal/mol,對應(yīng)的蛋白翻譯起始率和表達量則降低10倍。但是,必須指出的是,只有當翻譯的起始受到 mRNA二級結(jié)構(gòu)影響,或者該mRNA與核糖體的親和度較低的時候,這種比例關(guān)系才會存在。
因此,在基因序列設(shè)計和優(yōu)化的時候,合理地利用翻譯起始區(qū)的mRNA二級結(jié)構(gòu)的規(guī)律將有效提高目的蛋白的異源表達水平。上述推斷已被國內(nèi)外研究者多次應(yīng)用并證明有效。Punginelli等[45]通過突變大腸桿菌甲酸脫氫酶N的亞基G (FdnG) 信號肽的第一個精氨酸 (R5),降低了翻譯起始區(qū)強穩(wěn)定性莖環(huán)結(jié)構(gòu)的形成,顯著減小了mRNA該區(qū)域折疊自由能,使目的蛋白的表達水平最高提高了60倍。王珊珊等[41]對近平滑假絲酵母的(R)-羰基還原酶基因的mRNA翻譯起始區(qū)中+1~+78 區(qū)進行二級結(jié)構(gòu)的優(yōu)化,使酶蛋白在大腸桿菌的表達水平比優(yōu)化前提高了4~5倍。通過mRNA二級結(jié)構(gòu)優(yōu)化,尤其是翻譯起始區(qū)的二級結(jié)構(gòu)優(yōu)化提高目的蛋白的異源表達在基因工程領(lǐng)域的應(yīng)用已受到越來越多的重視。
其他要素或優(yōu)化方法還包括檢查單核苷酸重復和密碼子重復,核對核糖體結(jié)合位點,起始密碼子環(huán)境,終止密碼子及其環(huán)境,避免內(nèi)含子、隱蔽剪接位點、AT富含區(qū)、內(nèi)部核糖體進入位點 (IRES)、重組位點等不利元件,選擇合適的UTR序列和信號肽序列,合理設(shè)計酶切位點、接頭、融合基因、檢測和純化標簽等 (如表 1),使基因進一步優(yōu)化,檢查無誤后進行基因合成,以備后續(xù)的遺傳轉(zhuǎn)化和表達。
表1 其他影響蛋白表達的基因設(shè)計因素Table 1 Other gene design factors that influence protein expression
目前,越來越多的物種被發(fā)展成重組蛋白表達系統(tǒng),研究比較深入并且應(yīng)用相對廣泛的表達系統(tǒng)包括大腸桿菌表達系統(tǒng)、枯草芽胞桿菌表達系統(tǒng)、鏈霉菌表達系統(tǒng)、畢赤酵母表達系統(tǒng)、釀酒酵母表達系統(tǒng)、昆蟲表達系統(tǒng)、哺乳動物表達系統(tǒng)和植物表達系統(tǒng)等,另外,一些細胞的細胞器 (如葉綠體和線粒體等) 也被用于重組蛋白表達。利用細胞作為異源表達宿主生產(chǎn)重組蛋白被形象地稱為細胞工廠,分子農(nóng)業(yè),細胞生物反應(yīng)器等。基因設(shè)計有助于原始基因難以表達的蛋白在異源重組系統(tǒng)內(nèi)表達,以及提高目的蛋白的表達量。同樣,高效異源重組表達能使異源表達系統(tǒng)宿主作為生物反應(yīng)器生產(chǎn)除蛋白多肽外的其他代謝中間產(chǎn)物。本實驗室結(jié)合傳統(tǒng)的微生物篩選及菌種誘變等方法,利用重組表達系統(tǒng)高效表達sn-1,3專一性脂肪酶蛋白,并對其進行酶制劑化,以用于功能油脂 1,3-二油酸-2-棕櫚酸甘油三酯 (OPO) 的酶法制備。本實驗室在sn-1,3專一性脂肪酶的微生物高效表達方面已取得一定進展,今后將在 sn-1,3專一性脂肪酶在模式生物中的重組表達方面,結(jié)合蛋白和宿主自身特點,進一步利用基因設(shè)計和優(yōu)化提高脂肪酶的表達。
盡管通過異源表達系統(tǒng)提高重組蛋白的表達量的報道已不勝枚舉,但是絕大多數(shù)的蛋白還不能通過異源系統(tǒng)表達實現(xiàn)產(chǎn)業(yè)化之路。通過基因工程和生物工程的手段,不斷改善和優(yōu)化目的蛋白異源重組表達,還是今后發(fā)展的重要研究領(lǐng)域。另外,盡管人們在基因設(shè)計和優(yōu)化方面已獲得很多成功,對影響基因在轉(zhuǎn)錄和翻譯表達水平的各種影響因素及其作用機制的研究也取得長足進步,但是由于這些影響因素之間并非獨立存在,它們往往相互作用,構(gòu)成圍繞蛋白表達調(diào)控的動態(tài)網(wǎng)絡(luò),而目前的基因設(shè)計分析和優(yōu)化手段并不能達到從整體上完全掌控和調(diào)節(jié)這些因素,更多的是從單個因素或者少數(shù)幾個較為重要的因素進行優(yōu)化和設(shè)計。因此,現(xiàn)行的優(yōu)化和設(shè)計方法都不同程度地存在局限性,目前還沒有非常成熟基因優(yōu)化理論。因此,利用基因設(shè)計優(yōu)化策略提高異源宿主蛋白表達的方法應(yīng)該被看作是必要條件,而不是充分條件,同時還應(yīng)該考慮細胞、個體及環(huán)境等其他因素在基因轉(zhuǎn)錄、翻譯等表達水平的影響。
[1]Valero F. Heterologous expression systems for lipases: a review. Methods Mol Biol, 2012, 861:161?178.
[2]Schuster E, Dunn-Coleman N, Frisvad JC, et al.On the safety ofAspergillus niger--a review. Appl Microbiol Biotechnol, 2002, 59(4/5): 426?435.
[3]Itakura K, Hirose T, Crea R, et al. Expression inEscherichia coliof a chemically synthesized gene for the hormone somatostatin. Science, 1977,198(4321): 1056?1063.
[4]Fiers W, Grosjean H. Codon usage. Nature, 1979,277(5694): 328?328.
[5]Lithwick G, Margalit H. Hierarchy of sequence-dependent features associated with prokaryotic translation. Genome Res, 2003,13(12): 2665?2673.
[6]Karlin S, Mrazek J, Campbell A, et al.Characterizations of highly expressed genes of four fast-growing bacteria. J Bacteriol, 2001,183(17): 5025?5040.
[7]Brinkmann U, Mattes RE, Buckel P. High-level expression of recombinant genes inEscherichiacoliis dependent on the availability of the dnaY gene product. Gene, 1989, 85(1): 109?114.
[8]Zdanovsky AG, Zdanovskaia MV. Simple and efficient method for heterologous expression of clostridial proteins. Appl Environ Microbiol,2000, 66(8): 3166?3173.
[9]Clarke TFt, Clark PL. Rare codons cluster. PLoS ONE, 2008, 3(10): e3412.
[10]Komar AA, Guillemet E, Reiss C, et al. Enhanced expression of the yeast Ure2 protein inEscherichia coli: the effect of synonymous codon substitutions at a selected place in the gene. Biol Chem, 1998, 379(10): 1295?1300.
[11]Mellitzer A, Weis R, Glieder A, et al. Expression of lignocellulolytic enzymes inPichia pastoris.Microb Cell Fact, 2012, 11(1): 61.
[12]Mayfield MB, Kishi K, Alic M, et al.Homologous expression of recombinant manganese peroxidase inPhanerochaete chrysosporium. Appl Environ Microbiol, 1994,60(12): 4303?4309.
[13]Jia B, Yang JK, Liu WS, et al. Homologous overexpression of a lipase fromBurkholderia cepaciausing the lambda Red recombinase system. Biotechnol Lett, 2010, 32(4): 521?526.
[14]Thanaraj TA, Argos P. Ribosome-mediated translational pause and protein domain organization. Protein Sci, 1996, 5(8): 1594?1612.
[15]Zhang G, Ignatova Z. Folding at the birth of the nascent chain: coordinating translation with co-translational folding. Curr Opin Struct Biol,2011, 21(1): 25?31.
[16]Komar AA, Lesnik T, Reiss C. Synonymous codon substitutions affect ribosome traffic and protein folding duringin vitrotranslation. FEBS Lett, 1999, 462(3): 387?391.
[17]Angov E, Hillier CJ, Kincaid RL, et al.Heterologous protein expression is enhanced by harmonizing the codon usage frequencies of the target gene with those of the expression host.PLoS ONE, 2008, 3(5): e2189.
[18]Weber JL. Analysis of sequences from the extremely A+T-rich genome ofPlasmodium falciparum. Gene, 1987, 52(1): 103?109.
[19]Darko CA, Angov E, Collins WE, et al. The clinical-grade 42-kilodalton fragment of merozoite surface protein 1 ofPlasmodium falciparumstrain FVO expressed inEscherichia coliprotectsAotus nancymaiagainst challenge with homologous erythrocytic-stage parasites.Infect Immun, 2005, 73(1): 287?297.
[20]Chowdhury DR, Angov E, Kariuki T, et al. A potent malaria transmission blocking vaccine based on codon harmonized full length Pfs48/45 expressed inEscherichia coli. PLoS ONE, 2009,4(7): e6352.
[21]Bossi L, Ruth JR. The influence of codon context on genetic code translation. Nature, 1980,286(5769): 123?127.
[22]Gaber RF, Culbertson MR. Codon recognition during frameshift suppression inSaccharomyces cerevisiae. Mol Cell Biol, 1984, 4(10):2052?2061.
[23]Bossi L, Roth JR. Four-base codons ACCA,ACCU and ACCC are recognized by frameshift suppressor sufJ. Cell, 1981, 25(2): 489?496.
[24]Boycheva S, Chkodrov G, Ivanov I. Codon pairs in the genome ofEscherichiacoli.Bioinformatics, 2003, 19(8): 987?998.
[25]Gutman GA, Hatfield GW. Nonrandom utilization of codon pairs inEscherichia coli. Proc Natl Acad Sci USA, 1989, 86(10): 3699?3703.
[26]Irwin B, Heck JD, Hatfield GW. Codon pair utilization biases influence translational elongation step times. J Biol Chem, 1995,270(39): 22801?22806.
[27]Moura GR, Pinheiro M, Freitas A, et al.Species-specific codon context rules unveil non-neutrality effects of synonymous mutations.PLoS ONE, 2011, 6(10): e26817.
[28]Buchan JR, Aucott LS, Stansfield I. tRNA properties help shape codon pair preferences in open reading frames. Nucleic Acids Res, 2006,34(3): 1015?1027.
[29]Moura G, Pinheiro M, Arrais J, et al. Large scale comparative codon-pair context analysis unveils general rules that fine-tune evolution of mRNA primary structure. PLoS ONE, 2007, 2(9): e847.
[30]Hatfield GW, Roth DA. Optimizing scaleup yield for protein production: Computationally Optimized DNA Assembly (CODA) and Translation Engineering. Biotechnol Annu Rev,2007, 13: 27?42.
[31]Coleman JR, Papamichail D, Skiena S, et al.Virus attenuation by genome-scale changes in codon pair bias. Science, 2008, 320(5884):1784?1787.
[32]Mueller S, Coleman JR, Papamichail D, et al.Live attenuated influenza virus vaccines by computer-aided rational design. Nat Biotechnol,2010, 28(7): 723?726.
[33]Coleman JR, Papamichail D, Yano M, et al.Designed reduction ofStreptococcus pneumoniaepathogenicity via synthetic changes in virulence factor codon-pair bias. J Infect Dis, 2011, 203(9):1264?1273.
[34]Trinh R, Gurbaxani B, Morrison SL, et al.Optimization of codon pair use within the(GGGGS)3 linker sequence results in enhanced protein expression. Mol Immunol, 2004, 40(10):717?722.
[35]Baca AM, Hol WG. Overcoming codon bias: a method for high-level overexpression of Plasmodium and other AT-rich parasite genes inEscherichia coli. Int J Parasitol, 2000, 30(2):113?118.
[36]Mitarai N, Sneppen K, Pedersen S. Ribosome collisions and translation efficiency: optimization by codon usage and mRNA destabilization. J Mol Biol, 2008, 382(1): 236?245.
[37]Tanaka M, Tokuoka M, Shintani T, et al.Transcripts of a heterologous gene encoding mite allergen Der f 7 are stabilized by codon optimization inAspergillus oryzae. Appl Microbiol Biotechnol, 2012, 96(5): 1275?1282.
[38]Desmit MH, Vanduin J. Control of prokaryotic translational initiation by messenger-RNA secondary structure. Progr Nucl Acid Res Mol Biol, 1990, 38: 1?35.
[39]Tuller T, Waldman YY, Kupiec M, et al.Translation efficiency is determined by both codon bias and folding energy. Proc Natl Acad Sci USA, 2010, 107(8): 3645?3650.
[40]Freischmidt A, Liss M, Wagner R, et al. RNA secondary structure andin vitrotranslation efficiency. Protein Expr Purif, 2012, 82(1): 26?31.
[41]Wang S, Zhang R, Geng Y, et al. Improved expression and catalytic efficiency of(R)-carbonyl reductase inEscherichia coliby secondary structure optimization of mRNA translation initiation region. Chin J Biotech,2009, 25(12): 1907?1913 (in Chinese).
王珊珊, 張榮珍, 耿亞維, 等. mRNA翻譯起始區(qū)二級結(jié)構(gòu)優(yōu)化提高(R)-羰基還原酶的表達及催化效率. 生物工程學報, 2009, 25(12):1907–1913.
[42]Kudla G, Murray AW, Tollervey D, et al.Coding-sequence determinants of gene expression inEscherichia coli. Science, 2009,324(5924): 255?258.
[43]Zhou T, Wilke CO. Reduced stability of mRNA secondary structure near the translation-initiation site in dsDNA viruses. BMC Evol Biol, 2011, 11.
[44]Desmit M H, Vanduin J. Secondary structure of the ribosome binding-site determines translational efficiency - a quantitative-analysis. Proc Natl Acad Sci USA, 1990, 87(19): 7668?7672.
[45]Punginelli C, Ize B, Stanley NR, et al. mRNA secondary structure modulates translation of Tat-dependent formate dehydrogenase N. J Bacteriol, 2004, 186(18): 6311?6315.
[46]Gu T, Tan S, Gou X, et al. Avoidance of long mononucleotide repeats in codon pair usage.Genetics, 2010, 186(3): 1077?1084.
[47]Tats A, Tenson T, Remm M. Preferred and avoided codon pairs in three domains of life.BMC Genomics, 2008, 9: 463.
[48]Agaisse H, Lereclus D. STAB-SD: a Shine-Dalgarno sequence in the 5' untranslated region is a determinant of mRNA stability. Mol Microbiol, 1996, 20(3): 633?643.
[49]Kozak M. Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes. Cell, 1986,44(2): 283?292.
[50]Gingold H, Pilpel Y. Determinants of translation efficiency and accuracy. Mol Syst Biol, 2011, 7:481.
[51]Sun J, Chen M, Xu J, et al. Relationships among stop codon usage bias, its context, isochores, and gene expression level in various eukaryotes. J Mol Evol, 2005, 61(4): 437?444.
[52]Pacho F, Zambruno G, Calabresi V, et al.Efficiency of translation termination in humans is highly dependent upon nucleotides in the neighbourhood of a (premature) termination codon. J Med Genet, 2011, 48(9): 640?644.
[53]Kamo K, Kim AY, Park SH, et al. The 5'UTR-intron of the Gladiolus polyubiquitin promoter GUBQ1 enhances translation efficiency inGladiolusandArabidopsis. BMC Plant Biol,2012, 12: 79.
[54]Nishikubo T, Nakagawa N, Kuramitsu S, et al.Improved heterologous gene expression inEscherichia coliby optimization of the AT-content of codons immediately downstream of the initiation codon. J Biotechnol, 2005, 120(4):341?346.
[55]Attal J, Theron MC, Puissant C, et al. Effect of intercistronic length on internal ribosome entry site (IRES) efficiency in bicistronic mRNA. Gene Expr, 1999, 8(5/6): 299?309.
[56]Wang J, Lu C, Min D, et al. A mutation in the 5'untranslated region of the BRCA1 gene in sporadic breast cancer causes downregulation of translation efficiency. J Int Med Res, 2007, 35(4):564?573.
[57]Koda A, Minetoki T, Ozeki K, et al. Translation efficiency mediated by the 5' untranslated region greatly affects protein production inAspergillus oryzae. Appl Microbiol Biotechnol, 2004, 66(3):291?296.
[58]Klatt S, Konthur Z. Secretory signal peptide modification for optimized antibody-fragment expression-secretion inLeishmania tarentolae.Microb Cell Fact, 2012, 11: 97.
[59]Futatsumori-Sugai M, Tsumoto K. Signal peptide design for improving recombinant protein secretion in the baculovirus expression vector system. Biochem Biophys Res Commun, 2010,391(1): 931?935.
[60]Pozzuolo S, Breme U, Salis B, et al. Efficient bacterial expression of fusion proteins and their selective processing by a recombinant Kex-1 protease. Protein Expr Purif, 2008, 59(2):334?341.