楊云彭,馬曉焉,霍毅欣,2
生物工程與大健康
霍毅欣 北京理工大學(xué)生命學(xué)院教授,博士生導(dǎo)師。1999年在南開大學(xué)獲得微生物學(xué)學(xué)士學(xué)位,2005年同時獲得北京大學(xué)的生物化學(xué)與分子生物學(xué)專業(yè)博士學(xué)位和法國巴黎七大的分子微生物學(xué)及病毒學(xué)專業(yè)博士學(xué)位。2006–2011年在加州大學(xué)洛杉磯分校做博士后研究,2015年10月起在北京理工大學(xué)任教?,F(xiàn)任中國生物工程學(xué)會青年工作委員會副主任、中國化工學(xué)會生物化工青年學(xué)者工作委員會常務(wù)委員、中國生物工程學(xué)會氨基酸專業(yè)委員會委員。主要研究方向是代謝工程和合成生物學(xué),已在、、、、等刊物發(fā)表論文30余篇。
密碼子優(yōu)化策略在異源蛋白表達(dá)中的應(yīng)用
楊云彭1,馬曉焉1,霍毅欣1,2
1 北京理工大學(xué) 生命學(xué)院 分子醫(yī)學(xué)與生物診療工業(yè)和信息化部重點實驗室,北京 100081 2 蘇州工業(yè)園區(qū)洛加大先進(jìn)技術(shù)研究院 (蘇州),江蘇 蘇州 215123
酶在醫(yī)療和生物藥物方面有著廣泛的應(yīng)用,不僅可以用來治療各種疾病,還在臨床診斷和人體健康等方面有著重要的影響。利用微生物來表達(dá)異源蛋白已經(jīng)成為獲取酶最簡單快速的方法。為獲得高濃度和高質(zhì)量的異源蛋白,常用的方法是對基因序列進(jìn)行密碼子優(yōu)化。傳統(tǒng)的密碼子優(yōu)化策略主要基于密碼子偏好性和GC含量,忽略了翻譯動力學(xué)和代謝水平等復(fù)雜多樣的變化因素。文中從基因水平、轉(zhuǎn)錄水平、翻譯水平、翻譯后水平以及代謝水平等多方面考慮出發(fā),提供了一個較為全面的密碼子優(yōu)化策略,主要包括密碼子偏好性、密碼子協(xié)調(diào)性、密碼子敏感性、調(diào)整基因序列結(jié)構(gòu)以及一些其他影響因素。同時對每種策略的內(nèi)容、理論支持以及應(yīng)用范圍等方面作了全面的總結(jié),并將各策略的優(yōu)缺點進(jìn)行了系統(tǒng)的比較,為異源蛋白表達(dá)提供了全方位、多層次、多選擇的優(yōu)化策略,也為酶工業(yè)和生物藥物等方面提供參考。
密碼子優(yōu)化策略,異源蛋白表達(dá),密碼子偏好性,密碼子協(xié)調(diào)性,密碼子敏感性
酶是各種反應(yīng)的生物催化劑,在醫(yī)療和生物制藥等方面有著廣泛的用途,可用于疾病診斷治療、臨床檢測和養(yǎng)生保健等方面[1-3]。例如,在大腸桿菌中生產(chǎn)的1-天冬酰胺酶可用于治療白血病[4],在枯草芽孢桿菌生產(chǎn)的納豆激酶在血栓藥物治療上有著巨大前景[5]。微生物酶還可以用于治療由于遺傳問題、酶缺乏或消化紊亂引起的疾病,同時,還可以用于診斷行業(yè)的糖尿病檢測等診斷程序[6]。目前在背景清晰的模式菌株里表達(dá)異源蛋白已成為獲取微生物酶的最簡單方法。但在進(jìn)行異源蛋白表達(dá)時,密碼子優(yōu)化策略還存在很大的局限性?,F(xiàn)有的優(yōu)化策略主要從宿主本身出發(fā),意在消除稀有密碼子、調(diào)整GC含量和mRNA的穩(wěn)定性等,但該策略僅局限于tRNA濃度、基因結(jié)構(gòu)和mRNA穩(wěn)定性等,忽略了翻譯動力學(xué)、翻譯后折疊及代謝水平等這些復(fù)雜多樣的變化因素,導(dǎo)致一些異源蛋白的表達(dá)量仍很低[7-8]。此外,目前常用的密碼子優(yōu)化策略的另一個弊端是更多地強(qiáng)調(diào)蛋白的表達(dá)數(shù)量,對蛋白的質(zhì)量沒有嚴(yán)格的要求,常常出現(xiàn)蛋白翻譯或折疊錯誤等[7]。隨著生物技術(shù)的飛速發(fā)展,人們對于生物的作用機(jī)制更加了解,也為密碼子優(yōu)化提供了一些新的策略,包括密碼子的協(xié)調(diào)性[9]、密碼子的敏感性[10]以及一些其他轉(zhuǎn)錄和翻譯水平影響因素(圖1A)。密碼子協(xié)調(diào)性不同于密碼子偏好性,該策略更加注重蛋白的質(zhì)量,通過增加基因的耐受性來減少蛋白翻譯后折疊錯誤的出現(xiàn),從而維持了蛋白表達(dá)數(shù)量和質(zhì)量的協(xié)調(diào)性。密碼子敏感性策略則考慮到了氨?;痶RNA在脅迫條件下的波動性,為在底物不足或氨基酸饑餓條件下提供了一條新的密碼子優(yōu)化策略。
本文綜合考慮蛋白表達(dá)的各個影響因素,將密碼子的優(yōu)化策略分為5大類,即密碼子偏好性、密碼子協(xié)調(diào)性、密碼子敏感性、調(diào)整基因序列和其他影響因素。同時,總結(jié)了各個策略的內(nèi)容、理論支持、優(yōu)缺點以及應(yīng)用范圍等方面,為異源蛋白的表達(dá)提供一個較為全面的密碼子優(yōu)化策略,也為酶工業(yè)、生物藥物的制備和精準(zhǔn)醫(yī)療等方面提供參考。
在遺傳密碼中,mRNA上3個相鄰的堿基組成一個密碼子,一個密碼子可編碼一種氨基酸。在生物體中有61種密碼子、20種氨基酸[11],這是由于遺傳密碼具有簡并性,同一氨基酸對應(yīng)的多個密碼子被稱為同義密碼子[12-13]。但這些同義密碼子在翻譯的過程中使用的頻率并非一致,這種現(xiàn)象被稱為“密碼子偏好性”[14-15]。密碼子偏好性對蛋白的表達(dá)有著直接的影響,能通過tRNA在翻譯水平上改變蛋白的翻譯速度[16]。在同一生物中,攜帶同一種氨基酸的不同tRNA稱為同功受體tRNA,tRNA的濃度通常與其讀取的密碼子的頻率正相關(guān)[14-15]。在高度表達(dá)的基因中,編碼同種氨基酸的密碼子中往往有一個密碼子在頻率上占主導(dǎo)地位,并且該密碼子通常由最豐富的tRNA的同種受體讀取[17]。研究表明,這樣有偏好性使用的機(jī)制可加快蛋白質(zhì)合成,減少氨基酸取代錯誤[18]。因此,密碼子偏好性和同功受體tRNA濃度可能共同進(jìn)化[19-21],并且與低水平表達(dá)的基因相比,高水平表達(dá)的基因的選擇壓力更為顯著[22]。
密碼子偏好性優(yōu)化策略是目前最常用的密碼子優(yōu)化策略,主要是將供體密碼子與宿主基因組中具有最高頻率的同義密碼子進(jìn)行替換,利用 宿主中最豐富的密碼子來編碼優(yōu)化序列中的氨基酸[23-24]。該理論假定tRNA和蛋白翻譯呈直接線性關(guān)系,且忽略了蛋白翻譯的動力學(xué)相關(guān)影響[7],當(dāng)宿主細(xì)胞內(nèi)的密碼子頻率較高時,相應(yīng)的tRNA水平較高,翻譯速率較快,更利于蛋白含量的表達(dá)(圖1B)。密碼子使用偏好性的分析在生物醫(yī)藥方面具有重要應(yīng)用,通過改變密碼子分配從而產(chǎn)生更多蛋白質(zhì)的策略已經(jīng)廣泛用于蛋白質(zhì)藥物和核酸療法的生物生產(chǎn)中。例如,根據(jù)密碼子的偏好性在大腸桿菌中成功地表達(dá)出了抗生素、胰島素和疫苗等[25]。
利用密碼子偏好性策略來提高異源蛋白的表達(dá)水平已得到人們的廣泛認(rèn)可,但也有部分實驗結(jié)果表明,利用密碼子偏好性的優(yōu)化策略來進(jìn)行蛋白表達(dá)時,非但沒有增加蛋白的表達(dá)含量,反而使蛋白的含量降低[7-8]。密碼子偏好性策略主要基于高頻密碼子對應(yīng)的tRNA濃度較高,可直接加快蛋白的翻譯速率。但隨后人體內(nèi)翻譯速率實驗已證明tRNA濃度與翻譯水平并不呈直接相關(guān)[26-28],甚至有實驗證明,相同的tRNA可以以顯著的差異速率解碼不同的密碼子[29]。因此,當(dāng)將供體密碼子替換成宿主細(xì)胞內(nèi)高頻密碼子時,相應(yīng)密碼子的tRNA濃度較高,但實際用于蛋白質(zhì)合成的氨?;痶RNA濃度并不一定較高,相應(yīng)的合成蛋白的速率就會受到很大影響。同時,當(dāng)采用該方法策略獲得異源性蛋白時,高頻密碼子的使用消除了稀有密碼子使用時造成的核糖體暫停效應(yīng),導(dǎo)致部分蛋白折疊錯誤[7,18,30],最終形成包涵體,影響蛋白的質(zhì)量,不利于微生物酶工業(yè)化生產(chǎn)(表1)。
有研究表明,在mRNA翻譯較慢的區(qū)域?qū)⑹褂妙l率較低的密碼子改為使用頻率較高的同義密碼子可能對酶活性產(chǎn)生有害影響。在氯霉素乙酰轉(zhuǎn)移酶(CAT) 基因上將16個稀有密碼子替換成高頻密碼子,可影響mRNA突變區(qū)域的核糖體運輸并消除特定的翻譯暫停,導(dǎo)致蛋白質(zhì)錯誤折疊水平增加,比活率下降了20%[31]。相反,將稀有密碼子引入含有高頻密碼子使用的區(qū)域則會改變底物特異性。P-糖蛋白 (P-gp) 是多藥耐藥基因1 (MDR1) 的表達(dá)產(chǎn)物,也是ATP驅(qū)動的外排泵,與P-gp底物藥物的藥物代謝動力學(xué)和癌癥的多藥耐藥性相關(guān)。在P-gp表達(dá)的過程中,將高頻密碼子替換成稀有密碼子,tRNA則成為蛋白表達(dá)的限制因素,影響共翻譯折疊和P-gp插入細(xì)胞膜的時間,從而改變藥物和抑制劑相互作用位點的結(jié)構(gòu)[32]。如果引入密碼子的頻率不當(dāng),可能會使蛋白的天然結(jié)構(gòu)和功能發(fā)生變化,增加重組蛋白藥物的免疫原性,降低治療效果。因此,選擇合適頻率的密碼子是成功表達(dá)有活性蛋白的關(guān)鍵因素。為了最大限度地模擬宿主內(nèi)供體的天然翻譯動力學(xué),順利表達(dá)異源蛋白,我們可以采用密碼子協(xié)調(diào)性的優(yōu)化策略。該策略主要是將供體密碼子與宿主中使用頻率最為相似的密碼子進(jìn)行替換,利用頻率相似的密碼子來編碼蛋白。密碼子協(xié)調(diào)性優(yōu)化策略對酶工業(yè)生產(chǎn)過程的經(jīng)濟(jì)性具有重大影響,可顯著地降低生產(chǎn)成本。例如,在小牛血清凝乳酶生產(chǎn)的過程中,通過協(xié)調(diào)密碼子的使用,使凝乳酶原的量增加70%,為商業(yè)化生產(chǎn)帶來了極大效益[33]。此外還有文獻(xiàn)報道,將mRNA緩慢翻譯的區(qū)域段用小于或等于天然供體密碼子的同義密碼進(jìn)行編碼,最終使異源蛋白的表達(dá)含量提高了4–1 000倍,可用于疫苗生產(chǎn)[34]。同時,還可以利用密碼子的隨機(jī)分布[33]來維持密碼子的協(xié)調(diào),該方法主要是基于整個基因組中密碼子的頻率分布或高度表達(dá)基因的翻譯表來將供體密碼子分配到宿主的每個密碼子上。在這種情況下,密碼子被隨機(jī)分配,其概率由宿主密碼子頻率表給出[35-38]。隨后,可通過計算“用于替換供體密碼子的可能性(Likelihoods for selection to replace the donor codon,LSR-值)”來尋找最佳的密碼子(圖1C)[9]。目前,已有大量文獻(xiàn)報道根據(jù)密碼子協(xié)調(diào)性優(yōu)化策略成功地提高了異源蛋白的表達(dá)量,為微生物酶生產(chǎn)的迅速發(fā)展提供了支持[7, 9, 34, 39-42]。
在進(jìn)行異源蛋白表達(dá)時,如果僅引入最高頻率的密碼子,則有可能造成相應(yīng)氨?;痶RNA的濃度快速消耗,使底物成為蛋白翻譯的限制因 素[43],造成翻譯的過早終止或者錯誤的氨基酸摻入,從而影響蛋白的含量和質(zhì)量。利用密碼子協(xié)調(diào)性,將頻率最相似的密碼子引入到宿主中,則能在一定水平上增加基因的耐受性,減少和避免出現(xiàn)同功受體tRNA缺乏的情況出現(xiàn)。且該策略更加強(qiáng)調(diào)模擬宿主內(nèi)供體的天然翻譯動力學(xué),防止由于強(qiáng)制過表達(dá)時造成分子伴侶系統(tǒng)被破壞,從而使蛋白能最大限度地在宿主細(xì)胞內(nèi)高質(zhì)量表達(dá)。在翻譯中,同功受體tRNA的種類和氨?;目倽舛葲Q定了密碼子的翻譯速度[29]。在密碼子協(xié)調(diào)性策略中,最佳密碼子并非最高頻密碼子,因此,其tRNA需要更長的時間才能到達(dá)核糖體的A位點,導(dǎo)致核糖體在同源密碼子上的轉(zhuǎn)運延遲[44]。這樣的延遲調(diào)節(jié)了共翻譯折疊和分子伴侶相互作用的時間范圍,特別是在多結(jié)構(gòu)域蛋白質(zhì)中,增加了成功折疊事件的機(jī)會,避免了包涵體的形成(表1)。
根據(jù)氨?;痶RNA的可利用性在不同的生長和脅迫條件下有顯著不同[45-46],提出了“密碼子敏感性”這一概念[10]。密碼子敏感性指的是在細(xì)胞內(nèi)氨基酸缺乏的條件下,tRNA與氨基酸結(jié)合能力的強(qiáng)弱。結(jié)合能力隨氨基酸濃度降低呈緩慢降低的tRNA的敏感性較低,其相應(yīng)的密碼子被稱為低敏感性密碼子;結(jié)合能力隨氨基酸濃度降低呈快速降低的tRNA的敏感性較高,其相應(yīng)的密碼子被稱為高敏感性密碼子。隨后的實驗直接證實了該理論預(yù)測,在細(xì)胞缺乏相對應(yīng)氨基酸時,絲氨酸、亮氨酸、蘇氨酸和精氨酸家族中同功受體tRNA選擇性氨?;痆30, 45, 47]。并根據(jù)tRNA可用性估算了密碼子翻譯速率,展示了tRNA在整個大腸桿菌基因組翻譯過程中敏感性的動態(tài)變化[48],為微生物酶的工業(yè)化增加了新元素。
理論上,蛋白的合成速度與細(xì)胞內(nèi)tRNA和氨基酸的濃度相關(guān)[49-50],但是,大腸桿菌tRNA的濃度在所有代謝條件下基本恒定[51],因此,在底物缺乏的條件下,即當(dāng)核糖體翻譯機(jī)制對某種氨基酸的需求大于其生物合成速率時,氨基酸的供應(yīng)成為了蛋白合成的限制性因素。由于密碼子的頻率與敏感性并不呈對應(yīng)的關(guān)系[10],頻率較高的密碼子,其敏感性并不一定低。在饑餓條件下表達(dá)異源蛋白時,如果宿主中頻率較高的密碼子正好敏感性也較高,那么,采用密碼子偏好性來進(jìn)行密碼子優(yōu)化不僅不會使蛋白的表達(dá)量提高,反而會使蛋白的表達(dá)量降低。在這種情況下,如果采用的是低敏性的密碼子,即使氨基酸的濃度 降低,該低敏性密碼子對應(yīng)的tRNA相較其他的同功受體tRNA也有較高的氨?;?,也能維持蛋白的持續(xù)表達(dá)(圖1D)。反之,高敏性的密碼子所對應(yīng)的tRNA的氨?;綍S著氨基酸的濃度降低呈現(xiàn)較快的下降趨勢,即使細(xì)胞內(nèi)其他同功受體tRNA仍維持高水平的氨?;癄顟B(tài)也不能被細(xì)胞加以利用,會造成蛋白表達(dá)的暫緩甚至停止。
密碼子敏感性的優(yōu)化策略可廣泛地應(yīng)用于極端條件下或?qū)τ谂囵B(yǎng)基有嚴(yán)格要求的蛋白表達(dá),也可將其用于對蛋白質(zhì)量要求較高的結(jié)構(gòu)生物學(xué)、抗體或生物藥物的研究中。目前,利用密碼子敏感性的優(yōu)化策略還未得到推廣,只有文獻(xiàn)報道了關(guān)于大腸桿菌的密碼子敏感性數(shù)值[10],其他物種尚未見報道(表1)。
在異源蛋白表達(dá)中,研究者關(guān)注更多的是轉(zhuǎn)錄和翻譯過程,但基因序列本身對蛋白的表達(dá)也有一定影響。常見的對基因序列優(yōu)化方法有調(diào)整GC含量[52-54]、避免堿基重復(fù)[55-56]、消除限制酶識別位點[57]、Chi-site延伸重組熱點[57-58]等(圖1E,表1)。有研究表明,不同物種的GC含量顯著不同,基因序列中的GC含量能影響基因的表達(dá)和調(diào)控[59]。GC含量過高(大于70%) 會造成RNA二級結(jié)構(gòu)穩(wěn)定性增加,減慢或暫停翻譯;GC含量過低(小于30%) 則會減慢轉(zhuǎn)錄延伸,不利于蛋白的表達(dá)。GC含量的調(diào)整可通過相關(guān)的軟件進(jìn)行分析。例如,在大腸桿菌中,通過調(diào)整GC含量實現(xiàn)了肽脫甲酰酶的表達(dá),成為了治療癌癥的潛在藥物[60]。此外,密碼子進(jìn)行優(yōu)化時還需避免與位于開放閱讀框中可能干擾mRNA加工和翻譯功能的重要RNA基序相似,如Shine-Dalgarno序列[28],這可能會造成核糖體暫停[61]。在真核生物中則需要考慮到CpG的含量[62]和TATA盒[63]等因素,這對轉(zhuǎn)錄的啟動有著重要的影響。
影響異源蛋白表達(dá)的因素復(fù)雜多樣,除了上述因素外,還包括一些其他的轉(zhuǎn)錄水平和翻譯水平的影響因素。如mRNA二級結(jié)構(gòu)的穩(wěn)定性[64]、消除串聯(lián)稀有密碼子[65]、避免密碼子重復(fù)[66]、調(diào)整核糖體結(jié)合位點[67]和注意起始終止密碼的環(huán)境[68-69]等(圖1F,表1)。mRNA的折疊能量對翻譯效率具有顯著影響,特別是在起始密碼子附近,因為更穩(wěn)定的RNA二級結(jié)構(gòu)在翻譯起始前需要更多的能量展開。在大腸桿菌中,非最高頻密碼子與降低的折疊能量相關(guān),因為它們與其最高頻密碼子相比更傾向于富含AT,因此當(dāng)非最高頻密碼子位于編碼DNA序列的5′末端附近時,翻譯效率提高[70]。這表明密碼子最優(yōu)性必須與松散的RNA二級結(jié)構(gòu)相平衡,以便最大限度地提高翻譯效率[59, 71-72],此外,胞內(nèi)直接翻譯速率的測量[73-74]和核糖體起始和延伸的計算機(jī)模擬[75]證明了翻譯起始通常是蛋白質(zhì)合成中的限速步驟。在翻譯起始過程中,使用低頻密碼子不僅會減慢核糖體翻譯速率,甚至還可以通過降低核糖體從mRNA起始位點移出的速率來影響同一轉(zhuǎn)錄物上其他核糖體的翻譯啟動[76-77]。在細(xì)菌中核糖核酸酶E位點也可以影響mRNA結(jié)構(gòu)的穩(wěn)定性[78]。而在真核生物中還需考慮潛在的polyA位點,防止提前終止翻譯[79]。
圖1 密碼子優(yōu)化策略示意圖
密碼子優(yōu)化是實現(xiàn)異源蛋白高效表達(dá)的關(guān)鍵技術(shù)手段。密碼子偏好性策略適用性較廣,能用于大多數(shù)異源蛋白表達(dá),但由于蛋白表達(dá)量過高易造成折疊錯誤,形成包涵體。此時,可采用密碼子協(xié)調(diào)性優(yōu)化策略,將供體中密碼子與宿主中頻率最相似的同義密碼子進(jìn)行替換或?qū)⒐w密碼子根據(jù)密碼子頻率分配到宿主每個密碼子上,避免了因密碼子頻率過高而引起的翻譯終止或折疊錯誤等現(xiàn)象出現(xiàn)。密碼子協(xié)調(diào)性策略在異源蛋白表達(dá)中的使用可提高功能性蛋白表達(dá)的可靠性,對結(jié)構(gòu)生物學(xué)和生物技術(shù)有著重要的影響。此外,該策略為大腸桿菌等模式菌株進(jìn)行異源蛋白表達(dá)提供了極好的發(fā)展前景,也為許多潛在的疫苗和生物藥物的開發(fā)和制備提供了大力支持。密碼子敏感性優(yōu)化策略則考慮到了氨?;痶RNA的可利用性,將高敏感性的密碼子替換成低敏感性的密碼子,使蛋白在體內(nèi)氨基酸缺乏的條件下也能維持穩(wěn)定表達(dá)。該策略在蛋白質(zhì)工程、酶工程、代謝工程以及合成生物學(xué)中有著廣泛應(yīng)用,可用于在脅迫條件或其他極端條件下異源蛋白的表達(dá),也可用于氨基酸衍生物的發(fā)酵生產(chǎn)。但該策略還未得到廣泛應(yīng)用,因其研究還未完善,目前只報道了關(guān)于大腸桿菌的密碼子敏感性數(shù)值,其他生物密碼子敏感性尚在研究中。密碼子偏好性、密碼子協(xié)調(diào)性和密碼子敏感性優(yōu)化策略主要是在不同培養(yǎng)條件下,調(diào)整細(xì)胞體內(nèi)mRNA、tRNA、氨酰化tRNA、氨基酸含量以及蛋白表達(dá)的關(guān)系,最大可能地模擬天然蛋白的翻譯過程。因此,上述3種策略不受物種限制,可廣泛地應(yīng)用于大腸桿菌和酵母表達(dá)系統(tǒng)?;蚪Y(jié)構(gòu)和其他轉(zhuǎn)錄翻譯水平的影響因素復(fù)雜多樣,原核生物和真核生物的轉(zhuǎn)錄翻譯機(jī)制不同,在密碼子優(yōu)化中考慮的因素也不同,可根據(jù)宿主和異源蛋白的基因序列進(jìn)行適當(dāng)調(diào)整,從而提高蛋白的表達(dá)水平。
異源蛋白的表達(dá)已成為酶工業(yè)和疫苗制造過程的重要內(nèi)容,密碼子的優(yōu)化策略則是其中的關(guān)鍵因素。隨著科技的飛速發(fā)展,生物的生命活動解析會更為清晰,密碼子的優(yōu)化策略也將更加豐富多樣,從而為酶工業(yè)生產(chǎn)和生物藥物制備帶來新策略,為人類生命健康帶來新期望。
[1] Singh R, Kumar M, Mittal A, et al. Microbial enzymes: industrial progress in 21st century. 3 Biotech, 2016, 6(2): 174.
[2] Gurung N, Ray S, Bose S, et al. A broader view: microbial enzymes and their relevance in industries, medicine, and beyond. Biomed Res Int, 2013, 2013: 329121.
[3] Jin C. Preface for special issue on enzyme engineering (2018). Chin J Biotechnol, 2018, 34(7): 1021–1023 (in Chinese). 金城. 2018酶工程??蜓? 生物工程學(xué)報, 2018, 34(7): 1021–1023.
[4] Jain R, Zaidi DK, Verma Y, et al. L-Asparaginase: A promising enzyme for treatment of acute lymphoblastic leukiemia. People’s J Sci Res, 2012, 5(1): 29–35.
[5] Cho YH, Song JY, Kim KM, et al. Production of nattokinase by batch and fed-batch culture of. New Biotechnol, 2010, 27(4): 341–346.
[6] Vellard M. The enzyme as drug: application of enzymes as pharmaceuticals. Curr Opin Biotechnol, 2003, 14(4): 444–450.
[7] Buhr F, Jha S, Thommen M, et al. Synonymous codons direct cotranslational folding toward different protein conformations. Mol Cell, 2016, 61(3): 341–351.
[8] Zhu D, Cai G, Wu D, et al. Comparison of two codon optimization strategies enhancing recombinant Sus scrofa lysozyme production in. Cell Mol Biol (Noisy-le-grand), 2015, 61(2): 43–49.
[9] Rehbein P, Berz J, Kreisel P, et al. “CodonWizard”–An intuitive software tool with graphical user interface for customizable codon optimization in protein expression efforts. Prot Expres Purif, 2019, 160: 84–93.
[10] Elf J, Nilsson D, Tenson T, et al. Selective charging of tRNA isoacceptors explains patterns of codon usage. Science, 2003, 300(5626): 1718–1722.
[11] Crick FHC, Barnett L, Brenner S, et al. General nature of the genetic code for proteins. Nature, 1961, 192(4809): 1227–1232.
[12] Lagerkvist U. “Two out of three”: an alternative method for codon reading. Proc Natl Acad Sci USA, 1978, 75(4): 1759–1762.
[13] Ikemura T. Correlation between the abundance oftransfer RNAs and the occurrence of the respective codons in its protein genes. J Mol Biol, 1981, 146(1): 1–21.
[14] Sharp PM, Cowe E, Higgins DG, et al. Codon usage patterns in,,,,and: a review of the considerable within-species diversity. Nucleic Acids Res, 1988, 16(17): 8207–8211.
[15] Plotkin J B, Kudla G. Synonymous but not the same: the causes and consequences of codon bias. Nat Rev Genet, 2011, 12(1): 32–42.
[16] Sabi R, Tuller T. Modelling the efficiency of codon-tRNA interactions based on codon usage bias. DNA Res, 2014, 21(5): 511–526.
[17] Tuller T, Waldman YY, Kupiec M, et al. Translation efficiency is determined by both codon bias and folding energy. Proc Natl Acad Sci USA, 2010, 107(8): 3645–3650.
[18] Hanson G, Coller J. Codon optimality, bias and usage in translation and mRNA decay. Nat Rev Mol Cell Biol, 2017, 19(1): 20–30.
[19] Sharp PM, Emery LR, Zeng K. Forces that influence the evolution of codon bias. Philos Trans Roy Soc B Biol Sci, 2010, 365(1544): 1203–1212.
[20] Yannai A, Katz S, Hershberg R. The codon usage of lowly expressed genes is subject to natural selection. Genome Biol Evol, 2018, 10(5): 1237–1246.
[21] Hershberg R, Petrov DA. Selection on codon bias. Ann Rev Genet, 2008, 42(1): 287–299.
[22] Ehrenberg M, Kurland CG. Costs of accuracy determined by a maximal growth rate constraint. Quart Rev Biophys, 1984, 17(1): 45–85.
[23] Quax TEF, Claassens NJ, S?ll D, et al. Codon bias as a means to fine-tune gene expression. Mol Cell, 2015, 59(2): 149–161.
[24] Villalobos A, Ness JE, Gustafsson C, et al. Gene Designer: a synthetic biology tool for constructing artificial DNA segments. BMC Bioinformat, 2006, 7: 285.
[25] Kane JF. Effects of rare codon clusters on high-level expression of heterologous proteins in. Curr Opin Biotechnol, 1995, 6(5): 494–500.
[26] Curran JF, Yarus M. Rates of aminoacyl-tRNA selection at 29 sense codons. J Mol Biol, 1989, 209(1): 65–77.
[27] Bonekamp F, Dalb?ge H, Christensen T, et al. Translation rates of individual codons are not correlated with tRNA abundances or with frequencies of utilization in. J Bacteriol, 1989, 171(11): 5812–5816.
[28] Li GW, Oh E, Weissman JS. The anti-Shine- Dalgarno sequence drives translational pausing and codon choice in bacteria. Nature, 2012, 484(7395): 538–541.
[29] S?rensen MA, Pedersen S. Absolutetranslation rates of individual codons in: the two glutamic acid codons GAA and GAG are translated with a threefold difference in rate. J Mol Biol, 1991, 222(2): 265–280.
[30] Gong M, Gong F, Yanofsky C. Overexpression of tnaC ofinhibits growth by depleting tRNA2Proavailability. J Bacteriol, 2006, 188(5): 1892–1898.
[31] Komar AA, Lesnik T, Reiss C. Synonymous codon substitutions affect ribosome traffic and protein folding duringtranslation. FEBS Lett, 1999, 462(3): 387–391.
[32] Kimchi-Sarfaty C, Oh JM, Kim IW, et al. A “Silent” polymorphism in thegene changes substrate specificity. Science, 2007, 315(5811): 525–528.
[33] Menzella HG. Comparison of two codon optimization strategies to enhance recombinant protein production in. Microb Cell Fact, 2011, 10: 15.
[34] Angov E, Hillier CJ, Kincaid RL, et al. Heterologous protein expression is enhanced by harmonizing the codon usage frequencies of the target gene with those of the expression host. PLoS ONE, 2008, 3(5): e2189.
[35] Welch M, Govindarajan S, Ness JE, et al. Design parameters to control synthetic gene expression in. PLoS One, 2009, 4(9): e7002.
[36] Kodumal SJ, Patel KG, Reid R, et al. Total synthesis of long DNA sequences: Synthesis of a contiguous 32-kb polyketide synthase gene cluster. Proc Natl Acad Sci USA, 2004, 101(44): 15573–15578.
[37] Wang XX, Li XJ, Zhang ZL, et al. Codon optimization enhances secretory expression of Pseudomonas aeruginosa exotoxin A. Prot Expres Purif, 2010, 72(1): 101–106.
[38] Menzella HG, Reid R, Carney JR, et al. Combinatorial polyketide biosynthesis bydesign and rearrangement of modular polyketide synthase genes. Nat Biotechnol, 2005, 23(9): 1171–1176.
[39] Chowdhury DR, Angov E, Kariuki T, et al. A potent malaria transmission blocking vaccine based on codon harmonized full lengthexpressed in. PLoS One, 2009, 4(7): e6352.
[40] Angov E, Legler PM, Mease RM. Adjustment of codon usage frequencies by codon harmonization improves protein expression and folding//Evans TC Jr, Xu MQ, Eds. Heterologous Gene Expression in: Methods and Protocols. Totowa, NJ: Humana Press, 2011: 1–13.
[41] Mignon C, Mariano N, Stadthagen G, et al. Codon harmonization-going beyond the speed limit for protein expression. FEBS Lett, 2018, 592(9): 1554–1564.
[42] Asam C, Roulias A, Parigiani MA, et al. Harmonization of the genetic code effectively enhances the recombinant production of the major birch pollen allergen bet v 1. Int Arch Allergy Immunol, 2018, 177(2): 116–122.
[43] Fuglsang A. Codon optimizer: a freeware tool for codon optimization. Prot Expres Purif, 2003, 31(2): 247–249.
[44] Chu D, Barnes DJ, von der Haar T. The role of tRNA and ribosome competition in coupling the expression of different mRNAs in. Nucleic Acids Res, 2011, 39(15): 6705–6714.
[45] Dittmar KA, S?rensen MA, Elf J, et al. Selective charging of tRNA isoacceptors induced by amino-acid starvation. EMBO Rep, 2005, 6(2): 151–157.
[46] Dong HJ, Nilsson L, Kurland CG. Co-variation of tRNA abundance and codon usage inat different growth rates. J Mol Biol, 1996, 260(5): 649–663.
[47] Lindsley D, Bonthuis P, Gallant J, et al. Ribosome bypassing at serine codons as a test of the model of selective transfer RNA charging. EMBO Rep, 2005, 6(2): 147–150.
[48] Wohlgemuth SE, Gorochowski TE, Roubos JA. Translational sensitivity of thegenome to fluctuating tRNA availability. Nucleic Acids Res, 2013, 41(17): 8021–8033.
[49] Ingolia NT. Ribosome profiling: new views of translation, from single codons to genome scale. Nat Rev Genet, 2014, 15(3): 205–213.
[50] Mazumder GA, Uddin A, Chakraborty S. Comparative analysis of codon usage pattern and its influencing factors inand. Acta Parasitol, 2017, 62(4): 748–761.
[51] Yamao F, Andachi Y, Muto A, et al. Levels of tRNAs in bacterial cells as affected by amino acid usage in proteins. Nucleic Acids Res, 1991, 19(22): 6119–6122.
[52] Kiktev DA, Sheng ZW, Lobachev KS, et al. GC content elevates mutation and recombination rates in the yeast. Proc Natl Acad Sci USA, 2018, 115(30): E7109–E7118.
[53] Newman ZR, Young JM, Ingolia NT, et al. Differences in codon bias and GC content contribute to the balanced expression of TLR7 and TLR9. Proc Natl Acad Sci USA, 2016, 113(10): E1362–E1371.
[54] Kudla G, Lipinski L, Caffin F, et al. High guanine and cytosine content increases mRNA levels in mammalian cells. PLoS Biol, 2006, 4(6): e180.
[55] Gustafsson C, Govindarajan S, Minshull J. Codon bias and heterologous protein expression. Trends Biotechnol, 2004, 22(7): 346–353.
[56] Chamary JV, Parmley JL, Hurst LD. Hearing silence: non-neutral evolution at synonymous sites in mammals. Nat Rev Genet, 2006, 7(2): 98–108.
[57] Parret AHA, Besir H, Meijers R. Critical reflections on synthetic gene design for recombinant protein expression. Curr Opin Struct Biol, 2016, 38: 155–162.
[58] Taylor AF, Amundsen SK, Smith GR. Unexpected DNA context-dependence identifies a new determinant of Chi recombination hotspots. Nucleic Acids Res, 2016, 44(17): 8216–8228.
[59] Kudla G, Murray AW, Tollervey D, et al. Coding-sequence determinants of gene expression in. Science, 2009, 324(5924): 255–258.
[60] Han JH, Choi YS, Kim WJ, et al. Codon optimization enhances protein expression of human peptide deformylase. Prot Expres Purif, 2010, 70(2): 224–230.
[61] Mohammad F, Woolstenhulme CJ, Green R, et al. Clarifying the translational pausing landscape in bacteria by ribosome profiling. Cell Rep, 2016, 14(4): 686–694.
[62] Bauer AP, Leikam D, Krinner S, et al. The impact of intragenic CpG content on gene expression. Nucleic Acids Res, 2010, 38(12): 3891–3908.
[63] Jonkers I, Kwak H, Lis JT. Genome-wide dynamics of Pol II elongation and its interplay with promoter proximal pausing, chromatin, and exons. eLife 2014, 3: e02407.
[64] Kertesz M, Wan Y, Mazor E, et al. Genome-wide measurement of RNA secondary structure in yeast. Nature, 2010, 467(7311): 103–107.
[65] Clarke IV TF, Clark PL. Increased incidence of rare codon clusters at 5? and 3? gene termini: implications for function. BMC Genom, 2010, 11: 118.
[66] Gustafsson C, Minshull J, Govindarajan S, et al. Engineering genes for predictable protein expression. Prot Expres Purif, 2012, 83(1): 37–46.
[67] Mackie GA. RNase E: at the interface of bacterial RNA processing and decay. Nat Rev Microbiol, 2012, 11(1): 45–47.
[68] Shell SS, Wang J, Lapierre P, et al. Leaderless transcripts and small proteins are common features of the mycobacterial translational landscape. PLoS Genet, 2015, 11(11): e1005641.
[69] Srivastava A, Gogoi P, Deka B, et al.analysis of 5′-UTRs highlights the prevalence of Shine–Dalgarno and leaderless-dependent mechanisms of translation initiation in bacteria and archaea, respectively. J Theor Biol, 2016, 402: 54–61.
[70] Goodman DB, Church GM, Kosuri S. Causes and effects of N-terminal codon bias in bacterial genes. Science, 2013, 342(6157): 475–479.
[71] Gu WJ, Zhou T, Wilke CO. A universal trend of reduced mRNA stability near the translation- initiation site in prokaryotes and eukaryotes. PLoS Comput Biol, 2010, 6(2): e1000664.
[72] Tsao D, Shabalina SA, Gauthier J, et al. Disruptive mRNA folding increases translational efficiency of catechol--methyltransferase variant. Nucleic Acids Res, 2011, 39(14): 6201–6212.
[73] Morisaki T, Lyon K, Deluca KF, et al. Real-time quantification of single RNA translation dynamics in living cells. Science, 2016, 352(6292): 1425–1429.
[74] Wu B, Eliscovich C, Yoon YJ, et al. Translation dynamics of single mRNAs in live cells and neurons. Science, 2016, 352(6292): 1430–1435.
[75] Shah P, Ding Y, Niemczyk M, et al. Rate-limiting steps in yeast protein translation. Cell, 2013, 153(7): 1589–1601.
[76] Mitarai N, Sneppen K, Pedersen S. Ribosome collisions and translation efficiency: optimization by codon usage and mRNA destabilization. J Mol Biol, 2008, 382(1): 236–245.
[77] Potapov I, M?kel? J, Yli-Harja O, et al. Effects of codon sequence on the dynamics of genetic networks. J Theor Biol, 2012, 315: 17–25.
[78] Del Campo C, Bartholom?us A, Fedyunin I, et al. Secondary structure across the bacterial transcriptome reveals versatile roles in mRNA regulation and function. PLoS Genet, 2015, 11(10): e1005613.
[79] Proudfoot NJ. Ending the message: poly(A) signals then and now. Genes Dev, 2011, 25(17): 1770–1782.
Application of codon optimization strategy in heterologous protein expression
Yunpeng Yang1, Xiaoyan Ma1, and Yi-Xin Huo1,2
1 Key Laboratory of Molecular Medicine and Biotherapy, School of Life Sciences, Beijing Institute of Technology, Beijing100081, China 2 SIP-UCLA Institute for Technology Advancement (Suzhou), Suzhou215123, Jiangsu, China
Enzymes are widely used in medical and biopharmaceuticals. They can be used not only for various disease treatments, but also clinical diagnosis. The use of microorganisms to express heterologous proteins has become the easiest and fastest way to obtain enzymes. In order to obtain high concentration and high-quality heterologous proteins, a common method is codon optimization of gene sequences. The traditional codon optimization strategy is mainly based on codon bias and GC content, ignoring complex and varied factors such as translational dynamics and metabolic levels. We provide here comprehensive codon optimization strategy based on gene level, transcriptional level, translational level, post-translational level and metabolic level, mainly including codon bias, codon harmonization, codon sensitivity, adjustment of gene sequence structure and some other influencing factors. We also summarize the aspects of strategy content, theoretical support and application. Besides, the advantages and disadvantages of each strategy are also systematically compared, providing an all-round, multi-level and multi-selection optimization strategy for heterogeneous protein expression, and also providing references for the enzyme industry and biopharmaceuticals.
codon optimization strategies, heterologous protein expression, codon bias, codon harmonization, codon sensitivity
June 26, 2019;
September 3, 2019
National Key Research and Development Program of China (No. 2017YFD0201400), National Natural Science Foundation of China (No. 21676026).
Yi-Xin Huo. Tel: +86-10-68918158; E-mail: huoyixin@bit.edu.cn
國家重點研發(fā)計劃 (No. 2017YFD0201400),國家自然科學(xué)基金 (No. 21676026) 資助。
2019-10-31
http://kns.cnki.net/kcms/detail/11.1998.Q.20191031.1130.001.html
楊云彭, 馬曉焉, 霍毅欣. 密碼子優(yōu)化策略在異源蛋白表達(dá)中的應(yīng)用. 生物工程學(xué)報, 2019, 35(12): 2227–2237.
Yang YP, Ma XY, Huo YX. Application of codon optimization strategy in heterologous protein expression. Chin J Biotech, 2019, 35(12): 2227–2237.
(本文責(zé)編 郝麗芳)