徐友強(qiáng),馬翠卿,陶飛,許平
1 山東大學(xué) 微生物技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,濟(jì)南 250100
2 上海交通大學(xué) 微生物代謝教育部重點(diǎn)實(shí)驗(yàn)室,上海 200240
細(xì)菌啟動(dòng)子識(shí)別及應(yīng)用研究進(jìn)展
徐友強(qiáng)1,馬翠卿1,陶飛2,許平2
1 山東大學(xué) 微生物技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,濟(jì)南 250100
2 上海交通大學(xué) 微生物代謝教育部重點(diǎn)實(shí)驗(yàn)室,上海 200240
細(xì)菌啟動(dòng)子是細(xì)菌中基因表達(dá)的必需調(diào)控元件,決定了細(xì)菌基因表達(dá)的強(qiáng)度和時(shí)機(jī)。通過(guò)啟動(dòng)子的插入或缺失,可以改變細(xì)菌基因的表達(dá),實(shí)現(xiàn)對(duì)菌體生長(zhǎng)發(fā)育以及代謝調(diào)控的研究。啟動(dòng)子也是構(gòu)建各種表達(dá)系統(tǒng)、實(shí)現(xiàn)異源基因表達(dá)的基礎(chǔ)。啟動(dòng)子的識(shí)別和應(yīng)用研究,對(duì)于實(shí)現(xiàn)異源基因的可控表達(dá)、有效獲得目的產(chǎn)物、促進(jìn)生物催化和代謝工程研究具有重要的意義。以下對(duì)細(xì)菌啟動(dòng)子進(jìn)行了簡(jiǎn)單的介紹,總結(jié)了細(xì)菌啟動(dòng)子的識(shí)別方法,并對(duì)細(xì)菌啟動(dòng)子的研究進(jìn)展和具體應(yīng)用進(jìn)行了概述。
啟動(dòng)子識(shí)別,誘導(dǎo)型啟動(dòng)子,啟動(dòng)子應(yīng)用
隨著DNA測(cè)序技術(shù)的進(jìn)步,越來(lái)越多的細(xì)菌基因組被測(cè)序,為啟動(dòng)子識(shí)別和應(yīng)用提供了材料,大量啟動(dòng)子的發(fā)現(xiàn)及應(yīng)用,推動(dòng)了生物催化技術(shù)的發(fā)展。本文對(duì)細(xì)菌啟動(dòng)子進(jìn)行了簡(jiǎn)單的介紹,對(duì)其識(shí)別方法進(jìn)行了總結(jié),并對(duì)細(xì)菌啟動(dòng)子的研究和具體應(yīng)用進(jìn)展進(jìn)行了概述。
細(xì)菌啟動(dòng)子是指可與 RNA聚合酶結(jié)合以起始基因轉(zhuǎn)錄的DNA序列區(qū)域。細(xì)菌啟動(dòng)子的結(jié)構(gòu)一般包括?35區(qū)、?10區(qū)、?35區(qū)和?10區(qū)之間的區(qū)域以及轉(zhuǎn)錄起始位點(diǎn) (Transcription start site,TSS),其中,?35區(qū)位于起始轉(zhuǎn)錄區(qū)上游35 bp附近,一般為6個(gè)堿基,其序列一般為T(mén)TGACA,詳細(xì)形式為:T82T84G78A65C54A45(下標(biāo)表示最大頻率出現(xiàn)堿基對(duì)應(yīng)的百分?jǐn)?shù))[2],可以與RNA聚合酶結(jié)合從而起始轉(zhuǎn)錄[3-4]。?10區(qū)位于起始轉(zhuǎn)錄區(qū)上游10 bp附近,一般為6個(gè)堿基,序列一般為T(mén)ATAAT,詳細(xì)形式為:T80A95T45A60A50T96(下標(biāo)表示最大頻率出現(xiàn)堿基對(duì)應(yīng)的百分?jǐn)?shù))[2],其序列也與RNA聚合酶結(jié)合從而起始轉(zhuǎn)錄有關(guān),又叫Pribnow盒子 (Pribnow box)[3-4]。除此之外,一些細(xì)菌啟動(dòng)子還有特殊結(jié)構(gòu),如 UP元件、轉(zhuǎn)錄起始位點(diǎn)下游A/T富集區(qū)和延伸?10區(qū)。前者是指一段富含A/T堿基的序列,位于?35區(qū)上游,一般為轉(zhuǎn)錄起始位點(diǎn)上游40~60 bp范圍的富含A/T的區(qū)域,與RNA聚合酶的α亞基的C端終止域結(jié)合[5-6],其序列分為 2個(gè)部分:轉(zhuǎn)錄起始位點(diǎn)上游41~44 bp位置的AAAA和轉(zhuǎn)錄起始位點(diǎn)上游47~57 bp位置的AAA(A/T)(A/T)T(A/T)TTTT。轉(zhuǎn)錄起始位點(diǎn)的下游存在周期分布的A/T富集區(qū)域,主要集中在 6±3、23±3、40±2、56±2等位置[7]。延伸?10區(qū)是指位于?10區(qū)上游的幾個(gè)堿基,一般位于轉(zhuǎn)錄起始位點(diǎn)上游 13~17 bp處,序列一般為T(mén)GTGN[8],可以與RNA聚合酶結(jié)合,有利于RNA聚合酶起始轉(zhuǎn)錄??梢钥闯?,細(xì)菌啟動(dòng)子的保守序列在核心區(qū)域中按一定規(guī)律分布,彼此存在一定間隔。這使得各個(gè)區(qū)域均保持在雙螺旋的同一側(cè),從而有利于與RNA聚合酶相結(jié)合。但RNA聚合酶并不能直接與啟動(dòng)子DNA序列相結(jié)合起始轉(zhuǎn)錄[9],而是需要σ因子的輔助,形成RNA聚合酶全酶,才能與啟動(dòng)子DNA序列相結(jié)合[10]。
細(xì)菌的σ因子分為2個(gè)大類(lèi),σ70家族和σ54家族[11]。其中,σ70家族存在于幾乎所有細(xì)菌中,σ70家族大部分成員一般含有 4個(gè)結(jié)構(gòu)域:σ1、σ2、σ3和σ4,其中,σ2有利于RNA聚合酶β’亞基與啟動(dòng)子?10區(qū)結(jié)合,σ4有利于RNA聚合酶β亞基與啟動(dòng)子?35區(qū)結(jié)合[12]。σ54家族成員與 σ70相比,在氨基酸序列和轉(zhuǎn)錄機(jī)制上均有不同[13],其存在也不如σ70家族廣泛,已知研究發(fā)現(xiàn)在于變形菌中,它與氮源代謝的調(diào)控相關(guān)[13];在枯草芽胞桿菌中,它與精氨酸和鳥(niǎo)氨酸利用的調(diào)控[14]以及果糖轉(zhuǎn)運(yùn)有關(guān)[15]。另外,基因組測(cè)序顯示,σ54因子還存在于其他菌,如極度嗜熱菌、專(zhuān)性細(xì)胞內(nèi)病原體、螺旋菌和綠色硫細(xì)菌中[16]。σ54家族具有一些特殊的調(diào)控特性,如起始轉(zhuǎn)錄需要同源激活蛋白,使該起始轉(zhuǎn)錄具有嚴(yán)謹(jǐn)調(diào)控性且本底表達(dá)很低[17]。σ54-RNA聚合酶復(fù)合體行使功能需要較長(zhǎng)的基因間隔序列等[18]。
除此之外,還有一些特殊的σ因子,分別行使特定的不同功能,如與細(xì)菌環(huán)境壓力反應(yīng)和細(xì)菌生長(zhǎng)穩(wěn)定期相關(guān)的σs因子;與細(xì)胞質(zhì)熱反應(yīng)相關(guān)的σ32因子 (又名σH因子);與細(xì)菌饑餓反應(yīng)和鞭毛合成相關(guān)的 σ28因子 (又名σF因子);與細(xì)菌胞膜壓力反應(yīng)相關(guān)的σE因子等[19],在此不再贅述。
由于細(xì)菌啟動(dòng)子在生物催化中的重要作用,目前對(duì)細(xì)菌啟動(dòng)子研究的工作非常多。本文首先對(duì)細(xì)菌啟動(dòng)子的識(shí)別方法作一概括。
細(xì)菌啟動(dòng)子識(shí)別在啟動(dòng)子研究中起著重要作用。識(shí)別和發(fā)現(xiàn)新的啟動(dòng)子,對(duì)細(xì)菌啟動(dòng)子的研究具有重要的意義,可以提供具有不同啟動(dòng)強(qiáng)度、不同宿主適用范圍等特點(diǎn)的啟動(dòng)子,滿足生物催化技術(shù)的各種要求,促進(jìn)生物催化技術(shù)的發(fā)展。細(xì)菌啟動(dòng)子識(shí)別的目的是對(duì)已測(cè)序的細(xì)菌基因組的部分或全部進(jìn)行分析,從而識(shí)別出啟動(dòng)子的核心區(qū)域。在識(shí)別的基礎(chǔ)上,結(jié)合其他的實(shí)驗(yàn)方法,可以對(duì)細(xì)菌啟動(dòng)子進(jìn)行進(jìn)一步的驗(yàn)證。隨著啟動(dòng)子識(shí)別研究的深入,出現(xiàn)了許多啟動(dòng)子識(shí)別的方法,概要介紹如下。
細(xì)菌啟動(dòng)子具有多種共同的特征,如低穩(wěn)定性(Stability)、高彎曲率 (Curvature)、低的可彎曲性(Bendability)等[20-23],這為細(xì)菌啟動(dòng)子的預(yù)測(cè)提供了線索。
Kanhere等[24]研究發(fā)現(xiàn),啟動(dòng)子所在區(qū)域與細(xì)菌基因組的其他區(qū)域相比更加不穩(wěn)定,易發(fā)生熔解,從而有利于RNA的轉(zhuǎn)錄。在此基礎(chǔ)上對(duì)大腸桿菌、枯草芽胞桿菌和谷氨酸棒桿菌的啟動(dòng)子進(jìn)行了識(shí)別,分別發(fā)現(xiàn)了227、89和28個(gè)啟動(dòng)子,他們認(rèn)為該方法有很好的應(yīng)用性,并且如果將該方法與啟動(dòng)子的其他特征相結(jié)合會(huì)大大改善啟動(dòng)子序列的識(shí)別。
Wang等[25]研究發(fā)現(xiàn)細(xì)菌基因組有一些區(qū)域在超螺旋壓力下非常不穩(wěn)定,經(jīng)統(tǒng)計(jì)發(fā)現(xiàn),這些區(qū)域與含有啟動(dòng)子序列的基因間區(qū)域有關(guān)。他們將這一發(fā)現(xiàn)結(jié)合啟動(dòng)子已知的結(jié)構(gòu)和序列特征,進(jìn)行了啟動(dòng)子的識(shí)別。結(jié)果發(fā)現(xiàn),壓力誘導(dǎo)型DNA復(fù)式不穩(wěn)定 (Stress-induced DNA duplex destabilization,SIDD) 與特定的啟動(dòng)子區(qū)域有關(guān)。在E. coli K12的基因組序列中,與啟動(dòng)子DNA的其他特性如?10區(qū)的彎曲、形變、熱穩(wěn)定性或是序列結(jié)構(gòu)域相比,SIDD在啟動(dòng)子識(shí)別上具有非常高的準(zhǔn)確率 (高于80%)。除此之外,該方法也可用于枯草芽胞桿菌,識(shí)別準(zhǔn)確率也高于80%。
Towsey等[26]將DNA的結(jié)構(gòu)特征與基于計(jì)算機(jī)的識(shí)別方法相結(jié)合,建立了一個(gè)新的啟動(dòng)子識(shí)別方法。他們將壓力誘導(dǎo)型復(fù)式不穩(wěn)定 (SIDD)、DNA螺旋和折疊能量等參數(shù)結(jié)合在一起,以期能夠建立一個(gè)完善的啟動(dòng)子識(shí)別方法。然而他們發(fā)現(xiàn),啟動(dòng)子啟動(dòng)基因表達(dá)的相關(guān)特性并不是一成不變的,所以不可能建立啟動(dòng)子的完美的識(shí)別模型。
以上啟動(dòng)子識(shí)別方法的特異性并不是很高,但啟動(dòng)子的這些特征可以方便地與啟動(dòng)子其他的識(shí)別方法結(jié)合,使其具有潛在的應(yīng)用性。
細(xì)菌啟動(dòng)子在基因組中的分布并不是雜亂的,而是有一定的規(guī)律可循。在細(xì)菌中,σ因子和其他轉(zhuǎn)錄調(diào)控蛋白識(shí)別啟動(dòng)子DNA序列,然后與RNA聚合酶結(jié)合啟動(dòng)基因轉(zhuǎn)錄。進(jìn)化導(dǎo)致了轉(zhuǎn)錄因子識(shí)別的 DNA序列在細(xì)菌基因組的編碼區(qū)之間比較密集,而在編碼區(qū)則不常見(jiàn)。據(jù)此,可以進(jìn)行啟動(dòng)子的識(shí)別。
Jacques等[27]研究發(fā)現(xiàn)細(xì)菌基因組中轉(zhuǎn)錄因子結(jié)合區(qū)域的分布傾向于編碼區(qū)之間的區(qū)域,而且這一傾向存在于大部分的細(xì)菌中。在該發(fā)現(xiàn)的基礎(chǔ)上,他們建立了一個(gè)比直接的序列比對(duì)更有效的啟動(dòng)子識(shí)別方法。這一方法可以很容易地與其他的識(shí)別方法結(jié)合使用,而且可以同時(shí)用于對(duì)多個(gè)細(xì)菌基因組的分析。
由于細(xì)菌啟動(dòng)子的轉(zhuǎn)錄起始區(qū)域基因序列有固定的規(guī)律,Gordon等[28]以轉(zhuǎn)錄起始位點(diǎn) (Transcription start site,TSS) 為基礎(chǔ),利用計(jì)算機(jī)建立了一個(gè)算法。利用該算法,繪制了一幅大腸桿菌基因組的啟動(dòng)子圖譜。盡管該方法并不是很?chē)?yán)謹(jǐn),但卻是一個(gè)自動(dòng)的基因組水平上的啟動(dòng)子識(shí)別方法,簡(jiǎn)化了啟動(dòng)子識(shí)別的途徑。
盡管此類(lèi)方法比較簡(jiǎn)單,而且可以快速高效地識(shí)別啟動(dòng)子,但是該類(lèi)方法是建立在細(xì)菌基因組經(jīng)過(guò)系統(tǒng)注釋的基礎(chǔ)上的,故應(yīng)用范圍受到限制。
細(xì)菌啟動(dòng)子序列與基因組 DNA相比存在較明顯的特征,因此最直接的方法就是把啟動(dòng)子序列看成一種整體信號(hào),直接用各種模式發(fā)現(xiàn)的方法進(jìn)行識(shí)別。常用的方法有人工神經(jīng)網(wǎng)絡(luò) (Artificial neural network,ANN)[29]、隱馬爾可夫模型 (Hidden markov model,HMM)[30]等,還有研究將以上模型與啟動(dòng)子已知的特征相結(jié)合進(jìn)行啟動(dòng)子的識(shí)別,具體介紹如下。
Tavares等[31]利用幾種機(jī)器學(xué)習(xí)算法建立了對(duì)大腸桿菌基因組中啟動(dòng)子的識(shí)別方法。他們系統(tǒng)地比較了 Bayes (CNB;Na?ve Bayes;Na?ve Bayes Simple;NaiveBayesUpdateable;AODE)、Neural Net (Multiplayer Perceptron;SMO;RBF Network;Logistic;Voted Perceptron)、Meta (Logit Boost;MultiBoost AB;MultiClass Classifier;Threshold Selector;ADA Boost)、Trees (NBTree;LMT;ADTree;J48;ID3)、Lazy (LBR;IB1;Kstar;IBk;LWL) 和Rules (PART;Decision table;Ridor;JRip;NNge) 模型。經(jīng)過(guò)比較,他們發(fā)現(xiàn)以概率和神經(jīng)網(wǎng)絡(luò)系統(tǒng)為基礎(chǔ)的算法具有更高的準(zhǔn)確性。在細(xì)菌啟動(dòng)子識(shí)別中可以有選擇地使用這些模型,也可以互相搭配使用這些模型。
Du等[32]基于特征選擇的二次方程判別式分析方法 (Quadratic discriminant analysis,QDA) 進(jìn)行細(xì)菌啟動(dòng)子的識(shí)別,并且將啟動(dòng)子DNA的序列特征、信號(hào)特征、結(jié)構(gòu)特征等與二次方程判別式分析方法相結(jié)合,建立了一個(gè)啟動(dòng)子識(shí)別模型,并將該模型用于大腸桿菌啟動(dòng)子的識(shí)別。結(jié)果發(fā)現(xiàn),非編碼區(qū)的識(shí)別成功率為 85.7%,編碼區(qū)的識(shí)別成功率也接近80%。這一結(jié)果表明該算法是很有價(jià)值的一個(gè)啟動(dòng)子識(shí)別方法。他們還將該算法應(yīng)用于枯草芽胞桿菌,發(fā)現(xiàn)啟動(dòng)子的識(shí)別成功率也在80%左右,這說(shuō)明該方法具有較為廣泛的適用性。
Reis等[33]以隱馬爾可夫模式、閾值決定評(píng)估和辨別分析為基礎(chǔ),建立了一個(gè)細(xì)菌啟動(dòng)子識(shí)別方法,并將該方法應(yīng)用于細(xì)菌基因組的啟動(dòng)子識(shí)別,結(jié)果與以前的工作相比,對(duì)大腸桿菌的啟動(dòng)子識(shí)別錯(cuò)誤率下降了44.96%,對(duì)枯草芽胞桿菌的啟動(dòng)子識(shí)別準(zhǔn)確率和成功率分別為95%和78%,但對(duì)幽門(mén)螺旋桿菌的啟動(dòng)子識(shí)別成功率并不高。這說(shuō)明該算法具有較高的啟動(dòng)子識(shí)別準(zhǔn)確率和成功率,但適用范圍并不廣泛。
Dekhtyar等[34]建立了一個(gè)三維的強(qiáng)啟動(dòng)子識(shí)別模型,該模型可用于已注釋的細(xì)菌基因組啟動(dòng)子預(yù)測(cè),它與特定的大腸桿菌的I型RNA聚合酶σ70因子相匹配。它是通過(guò)將序列依次匹配3個(gè)條件來(lái)進(jìn)行預(yù)測(cè)的,這 3個(gè)條件依次是:含有 UP-元件;需要與α亞基作用;具有明顯可以區(qū)分的?35區(qū)和?10區(qū),以與RNA聚合酶的σ70亞基相互作用。利用該模型對(duì) 43個(gè)細(xì)菌基因組進(jìn)行了強(qiáng)啟動(dòng)子的識(shí)別。結(jié)果發(fā)現(xiàn),該三維強(qiáng)啟動(dòng)子識(shí)別模型適于細(xì)菌基因組 A+T含量在 62%以下的細(xì)菌基因組的強(qiáng)啟動(dòng)子識(shí)別。
總而言之,計(jì)算機(jī)建模方法首先根據(jù)已有的信息選擇結(jié)構(gòu)模型,然后用已知的序列數(shù)據(jù)作為訓(xùn)練集,通過(guò)相應(yīng)的訓(xùn)練算法,進(jìn)行訓(xùn)練得到模型參數(shù)。此類(lèi)方法對(duì)訓(xùn)練算法、模型參數(shù)的初值以及閾值都很敏感。雖然一些模型如神經(jīng)網(wǎng)絡(luò)模型和馬爾可夫模型可以分別通過(guò)增加神經(jīng)網(wǎng)絡(luò)的層數(shù)和馬爾可夫鏈的階次來(lái)提高模型復(fù)雜度,但由于利用的信息太寬泛,導(dǎo)致假陽(yáng)性較多,識(shí)別準(zhǔn)確率較低。
利用計(jì)算機(jī)來(lái)進(jìn)行細(xì)菌啟動(dòng)子的識(shí)別并沒(méi)有有效的利用啟動(dòng)子的轉(zhuǎn)錄特性,這意味著通常的啟動(dòng)子識(shí)別方法可能并不完善。細(xì)菌啟動(dòng)子啟動(dòng)mRNA的轉(zhuǎn)錄通常必須是在 RNA聚合酶及其輔因子的共同調(diào)控下進(jìn)行,利用這一特征可以有效準(zhǔn)確地進(jìn)行啟動(dòng)子識(shí)別。
Nakano等[35]利用Spx和RNA聚合酶α亞基C-端復(fù)合體進(jìn)行啟動(dòng)子識(shí)別。Spx是砷酸鹽還原酶家族的成員,是微生物壓力反應(yīng)的通用轉(zhuǎn)錄調(diào)控因子,在革蘭氏陽(yáng)性菌中高度保守。他們研究發(fā)現(xiàn),Spx和 αCTD形成一個(gè)復(fù)合體,該復(fù)合體可以識(shí)別 Spx調(diào)控基因的啟動(dòng)子DNA。當(dāng)Spx氧化成二硫化構(gòu)型時(shí),Spx的α螺旋 (α4) 結(jié)構(gòu)發(fā)生改變,而α4含有具有轉(zhuǎn)錄起始功能以及和 αCTD/Spx-啟動(dòng)子結(jié)合的殘基。根據(jù)這一結(jié)合特性,可以準(zhǔn)確地識(shí)別啟動(dòng)子序列。
這一方法準(zhǔn)確度高,但由于實(shí)驗(yàn)的復(fù)雜性及該現(xiàn)象的局限性,使其應(yīng)用具有很大的限制,但卻是對(duì)上述識(shí)別方法的一個(gè)很好的補(bǔ)充。
細(xì)菌表達(dá)系統(tǒng)研究中涉及到的啟動(dòng)子有很多種,大致可以分為誘導(dǎo)型啟動(dòng)子和組成型啟動(dòng)子兩大類(lèi)。其中,細(xì)菌表達(dá)系統(tǒng)中常用的誘導(dǎo)型啟動(dòng)子有l(wèi)ac啟動(dòng)子 (乳糖啟動(dòng)子)、trc和tac啟動(dòng)子 (乳糖和色氨酸的雜合啟動(dòng)子)、T7噬菌體啟動(dòng)子、L-阿拉伯糖誘導(dǎo)的 PBAD啟動(dòng)子、L-鼠李糖誘導(dǎo)的rhaPBAD啟動(dòng)子等,現(xiàn)分別介紹如下。
3.1.1 lac啟動(dòng)子
它來(lái)自大腸桿菌的乳糖操縱子。乳糖操縱子是DNA分子上一段有方向的核苷酸序列,由阻遏蛋白基因、啟動(dòng)基因、操縱基因和編碼 3個(gè)與乳糖利用有關(guān)的酶的基因所組成[36]。lac啟動(dòng)子受分解代謝系統(tǒng)的正調(diào)控和阻遏物的負(fù)調(diào)控。正調(diào)控通過(guò)CAP (Catabolite gene activation protein) 因子和cAMP來(lái)激活啟動(dòng)子,促進(jìn)轉(zhuǎn)錄。負(fù)調(diào)控則是由調(diào)節(jié)基因產(chǎn)生LacZ阻遏蛋白,該阻遏蛋白能與操縱基因結(jié)合阻止轉(zhuǎn)錄。
lac啟動(dòng)子應(yīng)用非常廣泛,分子生物學(xué)研究中常用的載體很多都含有 lac啟動(dòng)子,可以加入誘導(dǎo)物IPTG以啟動(dòng)目的基因的表達(dá),但是該啟動(dòng)子與 tac和trc啟動(dòng)子相比,啟動(dòng)效率較低,不利于目的蛋白的高效表達(dá)[37]。
3.1.2 tac和trc啟動(dòng)子
tac啟動(dòng)子是由lac啟動(dòng)子和trp啟動(dòng)子人工構(gòu)建的雜合啟動(dòng)子[38],受LacI阻遏蛋白的負(fù)調(diào)節(jié),它的啟動(dòng)能力比lac和trp都強(qiáng)[39]。其中tacI啟動(dòng)子的?20到起始位點(diǎn)的區(qū)域來(lái)自trp啟動(dòng)子,其余部分來(lái)自于lac UV5啟動(dòng)子;tacII啟動(dòng)子的?11到起始位點(diǎn) (包括Pribnow盒子) 來(lái)自trp啟動(dòng)子,其余部分由一個(gè)合成的46 bp DNA片段加上lac操縱子中的操縱基因和SD序列融合而成[38]。
trc啟動(dòng)子也是由 trp啟動(dòng)子和 lac啟動(dòng)子人工構(gòu)建的雜合啟動(dòng)子,由lac UV5啟動(dòng)子的?10區(qū)和trp啟動(dòng)子的?35區(qū)構(gòu)成[37],同樣具有比lac更高的轉(zhuǎn)錄效率[39]和受阻遏蛋白 LacI調(diào)控的強(qiáng)啟動(dòng)子特性。trc啟動(dòng)子的平均效率只有tac啟動(dòng)子的90%[39]。這兩個(gè)啟動(dòng)子均受IPTG誘導(dǎo)調(diào)節(jié)。
3.1.3 T7噬菌體啟動(dòng)子
T7噬菌體啟動(dòng)子具有高度的特異性,只有 T7 RNA聚合酶才能使其啟動(dòng),許多外源終止子都不能有效地終止T7 RNA聚合酶,因此它可以轉(zhuǎn)錄某些不能被大腸桿菌RNA聚合酶有效轉(zhuǎn)錄的序列,可以高效表達(dá)其他系統(tǒng)不能有效表達(dá)的基因,這使該啟動(dòng)子成為目前應(yīng)用最為廣泛的啟動(dòng)子之一[40]。T7 RNA聚合酶與大腸桿菌RNA聚合酶相比,在轉(zhuǎn)錄時(shí)對(duì)DNA鏈的延伸效率要高數(shù)倍,使其可以很好地應(yīng)用于E. coli BL21 (DE3) 表達(dá)宿主,因?yàn)镋. coli BL21 (DE3) 宿主基因組上含有 T7 RNA聚合酶基因,該基因通過(guò)lac啟動(dòng)子系列的L8-UV5 lac啟動(dòng)子調(diào)控[41]。L8-UV5 lac啟動(dòng)子因?yàn)楹型蛔兾稽c(diǎn)而與野生型lac啟動(dòng)子相區(qū)別。在它的?10區(qū)有2個(gè)位點(diǎn)的突變,這增強(qiáng)了它的啟動(dòng)效率,并且降低了它對(duì)AMP循環(huán)的依賴,另外它還有一個(gè)位點(diǎn)的突變,這導(dǎo)致了該啟動(dòng)子對(duì)葡萄糖的敏感性降低[41],即在葡萄糖存在的情況下,T7 RNA聚合酶也可以被IPTG有效地誘導(dǎo)表達(dá)。但由于其啟動(dòng)效率很高,如果表達(dá)的外源蛋白對(duì)宿主有毒害,則不利于外源基因的表達(dá)[42]。這也使得該啟動(dòng)子在應(yīng)用中存在一定的局限。
3.1.4 L-阿拉伯糖誘導(dǎo)的PBAD啟動(dòng)子
L-阿拉伯糖誘導(dǎo)的PBAD啟動(dòng)子來(lái)自于阿拉伯糖操縱子。阿拉伯糖操縱子是指令合成糖分解代謝所需酶系的操縱子,具有正、負(fù)調(diào)節(jié)的功能。它有 2個(gè)啟動(dòng)子Pc和PBAD,可以雙向轉(zhuǎn)錄。
阿拉伯糖誘導(dǎo)的PBAD啟動(dòng)子已經(jīng)被廣泛地用于大腸桿菌和其他宿主中表達(dá)異源基因[43-45]。當(dāng)阿拉伯糖加入培養(yǎng)基后,它會(huì)與蛋白AraC結(jié)合,從而使結(jié)合于PBAD和PC之間araI1和araI2基因位置上的蛋白 AraC脫落下來(lái)[46]。當(dāng)不存在阿拉伯糖時(shí),蛋白AraC結(jié)合在PBAD和PC之間并不脫落下來(lái),這一特性使araC-PBAD表達(dá)系統(tǒng)具有如下性質(zhì):當(dāng)阿拉伯糖不存在時(shí)只有很少量的本底表達(dá),并且可以通過(guò)控制 L-阿拉伯糖的加入調(diào)控基因的表達(dá)水平。araC-PBAD表達(dá)系統(tǒng)調(diào)控基因表達(dá)時(shí)表現(xiàn)出的是一種全或無(wú)的調(diào)控特性[47],即在沒(méi)有L-阿拉伯糖加入時(shí)不表達(dá)基因,而在低濃度L-阿拉伯糖加入時(shí),只有部分細(xì)胞誘導(dǎo)表達(dá),另一部分細(xì)胞不誘導(dǎo)表達(dá),隨著L-阿拉伯糖濃度的增加,誘導(dǎo)表達(dá)的細(xì)胞比例增加,而且已被誘導(dǎo)表達(dá)的細(xì)胞表達(dá)強(qiáng)度并不隨L-阿拉伯糖的濃度變化而變化。
3.1.5 L-鼠李糖誘導(dǎo)的rhaPBAD啟動(dòng)子
L-鼠李糖誘導(dǎo)的 rhaPBAD啟動(dòng)子來(lái)源于鼠李糖調(diào)節(jié)子,該調(diào)節(jié)子包括啟動(dòng)子PBAD及其控制的結(jié)構(gòu)基因rhaA、rhaB和rhaD,啟動(dòng)子Pt及其控制的結(jié)構(gòu)基因rhaT,啟動(dòng)子Psr及其控制的調(diào)節(jié)基因rhaS和 rhaR。L-鼠李糖誘導(dǎo)的 rhaPBAD啟動(dòng)子是一個(gè)非常好的在大腸桿菌中嚴(yán)謹(jǐn)調(diào)控外源基因表達(dá)的工具。L-鼠李糖作為誘導(dǎo)物可以與蛋白R(shí)haR一起誘導(dǎo)RhaS的合成,RhaS具有正調(diào)控鼠李糖調(diào)節(jié)子的功能[48]。
當(dāng)環(huán)境中無(wú) L-鼠李糖時(shí),rhaSR雖存在一定數(shù)量的本底表達(dá),但啟動(dòng)子效率極低;當(dāng)存在L-鼠李糖時(shí),RhaR被活化結(jié)合到rhaSR操縱子的特定區(qū)域,并與CRP和RNA聚合酶的α-CTD (RNA聚合酶α亞基 C-端復(fù)合體) 相互作用起始自身的表達(dá),同時(shí)表達(dá)RhaS。當(dāng)RhaS積累到一定程度,就會(huì)結(jié)合到rhaBAD和 rhaT啟動(dòng)子區(qū)的特定 DNA位點(diǎn)上與CRP、RNA聚合酶一起啟動(dòng)基因的表達(dá)[49-50]。
表1 細(xì)菌常用誘導(dǎo)型啟動(dòng)子特性總結(jié)Table 1 Summary of the characteristics of common bacterial promoters
除了這些常用的啟動(dòng)子外,四環(huán)素誘導(dǎo)的 tetA啟動(dòng)子也很常用。tetA啟動(dòng)子常用于大腸桿菌高效且嚴(yán)謹(jǐn)調(diào)控外源基因的表達(dá)[51-52]。與其他表達(dá)系統(tǒng)相比,該表達(dá)系統(tǒng)在大腸桿菌中的本底表達(dá)量非常低,這也使其應(yīng)用具有一定的優(yōu)勢(shì)。除了上述這些啟動(dòng)子外,來(lái)自于TOL質(zhì)粒的調(diào)控甲苯代謝的啟動(dòng)子[53],來(lái)自于 NAH質(zhì)粒的調(diào)控萘代謝的啟動(dòng)子[54]以及最近用于丙酸鹽代謝研究的啟動(dòng)子[55-56]也得到了廣泛的應(yīng)用。細(xì)菌誘導(dǎo)型啟動(dòng)子的具體應(yīng)用主要有以下4個(gè)方面:
3.2.1 細(xì)菌啟動(dòng)子在蛋白質(zhì)生產(chǎn)中的應(yīng)用
這是細(xì)菌啟動(dòng)子應(yīng)用最為廣泛的方面。通過(guò)改造現(xiàn)有載體,插入不同的啟動(dòng)子可獲得各種不同需要的載體,滿足不同蛋白質(zhì)生產(chǎn)的要求。
Skerra等[51]構(gòu)建了一個(gè)以大腸桿菌為宿主的含有 PtetA啟動(dòng)子的嚴(yán)謹(jǐn)調(diào)控型的表達(dá)載體。通過(guò)低濃度無(wú)水四環(huán)素的加入即可方便地誘導(dǎo)外源基因的表達(dá)。并以重組小鼠免疫球蛋白Fab片段的生產(chǎn)作為實(shí)例,檢測(cè)了該系統(tǒng)的性能,發(fā)現(xiàn)該系統(tǒng)功能的行使具有獨(dú)立性,不依賴于宿主,而且在沒(méi)有誘導(dǎo)物時(shí)無(wú)本底表達(dá),是一個(gè)很好的IPTG誘導(dǎo)的啟動(dòng)子系統(tǒng)的替代系統(tǒng),在異源基因表達(dá)方面具有很大的應(yīng)用前景。
Lee等[56]構(gòu)建了可應(yīng)用于大腸桿菌的pPro系列的表達(dá)載體,pPro載體含有prpBCDE啟動(dòng)子,通過(guò)在啟動(dòng)子后插入綠色熒光蛋白基因gfp,檢測(cè)了該系統(tǒng)的效率和調(diào)控特性。這一系列的表達(dá)系統(tǒng)在沒(méi)有丙酸鹽存在的條件下本底表達(dá)很低,在丙酸鹽存在的條件下是可控表達(dá)的,而且在高濃度丙酸鹽存在的條件下具有很高的表達(dá)強(qiáng)度,這些特征使該系列的載體在蛋白質(zhì)及代謝產(chǎn)物生產(chǎn)領(lǐng)域中具有很大的應(yīng)用前景。
黃素 c-硫化脫氫酶 (Flavcytochrome c-sulfide dehydrogenase,F(xiàn)CSD) FCSD酶在以還原型硫化物為電子供體固定二氧化碳的細(xì)菌中廣泛存在。FCSD酶是一個(gè)異源二聚體酶,包括1個(gè)黃素 (FAD) 亞基和1~2個(gè)c-型亞鐵血紅素亞基。但是利用不同載體在大腸桿菌中表達(dá)可溶性的光合細(xì)菌酒色著色菌Allochromatium vinosum FCSD酶和空泡外硫紅螺菌Ectothiorhodospira vacuolata膜結(jié)合蛋白并未成功,盡管這些載體可以表達(dá)FCSDs酶并分泌到細(xì)胞周質(zhì)中,但FCSDs酶并不與亞鐵血紅素亞基結(jié)合,從而沒(méi)有活性。為了解決這一問(wèn)題,Smet等[57]建立了一個(gè)可以應(yīng)用于光合宿主的新的表達(dá)系統(tǒng)。他們?cè)诖竽c桿菌中,利用一個(gè)寬宿主范圍表達(dá)質(zhì)粒pGV910,插入A. vinosum RuBisCo基因的啟動(dòng)子rbcA,通過(guò)結(jié)合方式將構(gòu)建的質(zhì)粒轉(zhuǎn)化到光合細(xì)菌莢膜紅細(xì)菌Rba. Capsulatus、球狀紅細(xì)菌 Rba. sphaeroides和Ect. vacuolata中,2個(gè)Rhodobacter宿主均可以成功地表達(dá)有活性的FCSD酶。這表明該表達(dá)系統(tǒng)在表達(dá)同源重組 c-型的細(xì)胞色素中具有很大的應(yīng)用前景。
3.2.2 細(xì)菌啟動(dòng)子在化合物降解中的應(yīng)用
啟動(dòng)子在化合物降解中的應(yīng)用主要在于調(diào)控載體基因簇上的基因表達(dá)。
TOL質(zhì)粒pWW53含有甲苯代謝的相關(guān)基因簇。它含有1個(gè)upper代謝基因簇 (包括調(diào)控基因xylR),可以將甲苯氧化為苯甲酸鈉。除此之外,該質(zhì)粒還含有2個(gè)功能同源的meta代謝基因簇 (包括調(diào)控基因 xylS1和 xylS3),可以代謝芳香羧酸。Gallegos等[53]研究發(fā)現(xiàn),當(dāng)培養(yǎng)基中沒(méi)有相關(guān)代謝底物時(shí),upper和meta代謝通路的相關(guān)基因簇均不表達(dá),但xylR基因在 σ70依賴性的啟動(dòng)子作用下得到表達(dá)。xylS1和xylS3基因也在σ70依賴性的啟動(dòng)子Ps2和Ps3作用下得到表達(dá)。當(dāng)培養(yǎng)基中存在O-二甲苯時(shí),XylR蛋白具有活性并且激發(fā)啟動(dòng)子Pu,起始upper基因簇的表達(dá)。當(dāng)環(huán)境中含有苯甲酸鈉時(shí),upper代謝通路不起作用,但 2個(gè) meta代謝基因簇均得到表達(dá)。當(dāng)環(huán)境中存在3-甲苯時(shí),2個(gè)meta代謝基因簇也會(huì)同時(shí)表達(dá)。以上特性使得該質(zhì)粒在甲苯、苯甲酸以及芳香羧酸化合物降解中具有廣泛的應(yīng)用性。
質(zhì)粒NAH7含有化合物萘降解的基因簇,該質(zhì)粒是假單胞菌中發(fā)現(xiàn)的第一個(gè)具有代謝作用的質(zhì)粒,可使其相應(yīng)宿主具有代謝萘和水楊酸鹽的能力。NAH7質(zhì)粒上的基因簇分為2個(gè)區(qū)域,第一個(gè)區(qū)域?yàn)榛虼豱ahABCDEF,可將化合物萘轉(zhuǎn)化為水楊酸鹽;第二個(gè)區(qū)域包括基因簇nahGHIJK,包括水楊酸鹽氧化代謝途徑相關(guān)酶的基因。Yen等[54]將轉(zhuǎn)座子Tn5插入到質(zhì)粒NAH7中,系統(tǒng)研究了Tn5對(duì)化合物萘氧化代謝相關(guān)步驟的影響,結(jié)果發(fā)現(xiàn)Tn5可以誘導(dǎo)nahR基因,nahR基因?qū)υ撡|(zhì)?;虼氐?個(gè)區(qū)域的基因簇均具有正調(diào)控的功能。對(duì)質(zhì)粒 NAH7的研究有利于更好了解萘代謝的機(jī)理,從而促進(jìn)質(zhì)粒NAH7對(duì)萘及其相關(guān)化合物降解的研究。
3.2.3 細(xì)菌啟動(dòng)子在物質(zhì)檢測(cè)中的應(yīng)用
由于誘導(dǎo)型啟動(dòng)子誘導(dǎo)物的專(zhuān)一性較強(qiáng),使細(xì)菌啟動(dòng)子在物質(zhì)檢測(cè)中的應(yīng)用具有特異性,即一個(gè)構(gòu)建好的檢測(cè)系統(tǒng)可以專(zhuān)一性地檢測(cè)某一化合物或某一類(lèi)化合物。
Korpela等[52]將生物發(fā)光法用于對(duì)四環(huán)素類(lèi)抗生素的檢測(cè)。即將一個(gè)信號(hào)感應(yīng)的質(zhì)粒導(dǎo)入到大腸桿菌中,該質(zhì)粒必須是嚴(yán)謹(jǐn)調(diào)控型的質(zhì)粒并帶有一個(gè)敏感性高的報(bào)告基因。Korpela等構(gòu)建了質(zhì)粒pTetLuX1,含有嚴(yán)謹(jǐn)調(diào)控型的啟動(dòng)子 PtetA,在該啟動(dòng)子的下游插入了 5個(gè)熒光素酶基因。利用這一質(zhì)粒構(gòu)造的重組菌可用于四環(huán)素及四環(huán)素類(lèi)化合物的檢測(cè),而且檢測(cè)的精度會(huì)隨著pH及Mg2+濃度的變化而變化,實(shí)際檢測(cè)中可以通過(guò)調(diào)節(jié)pH及Mg2+的濃度來(lái)調(diào)節(jié)檢測(cè)的精度,滿足不同檢測(cè)標(biāo)準(zhǔn)的要求。
Anderson等[58]在大腸桿菌中建立了一個(gè)人工合成的AND門(mén),基本過(guò)程是通過(guò)2個(gè)啟動(dòng)子作為“輸入”項(xiàng),當(dāng) 2個(gè)啟動(dòng)子均被誘導(dǎo)時(shí),會(huì)導(dǎo)致另外一個(gè)啟動(dòng)子被誘導(dǎo),即產(chǎn)生“輸出”。兩組啟動(dòng)子之間的聯(lián)系通過(guò)mRNA和tRNA的相互作用來(lái)實(shí)現(xiàn)。第一個(gè)啟動(dòng)子啟動(dòng)T7 RNA聚合酶基因的表達(dá) (在聚合酶基因后存在2個(gè)內(nèi)在的amber終止密碼子),第二個(gè)啟動(dòng)子啟動(dòng)amber抑制的tRNA supD基因。當(dāng)2個(gè)基因均表達(dá)時(shí),T7 RNA聚合酶才具有活性并啟動(dòng) T7啟動(dòng)子。該方法的輸入與輸出項(xiàng)均是可調(diào)控的,即輸入項(xiàng)的 2個(gè)啟動(dòng)子可以與不同的信號(hào)相關(guān)聯(lián),然后可以輸出不同的細(xì)胞信號(hào)反應(yīng),反應(yīng)靈敏,而且高效。
3.2.4 細(xì)菌啟動(dòng)子在代謝通路研究中的應(yīng)用
這是啟動(dòng)子應(yīng)用中非常重要的一個(gè)方面,啟動(dòng)子在這方面的應(yīng)用具有很大優(yōu)勢(shì),因?yàn)楝F(xiàn)有啟動(dòng)子很多,可提供各種不同誘導(dǎo)強(qiáng)度和不同適用范圍的啟動(dòng)子;檢測(cè)的準(zhǔn)確度及效率也很高,一定程度上滿足了代謝通路研究的需要。
生物代謝通路研究中一個(gè)很重要的問(wèn)題是確定代謝通路中的基因是如何行使功能的。Guet等[59]利用組合合成的方法,在大腸桿菌中建立了一個(gè)代謝通路連接位點(diǎn)可變的代謝網(wǎng)絡(luò)庫(kù)。該網(wǎng)絡(luò)庫(kù)是以啟動(dòng)子Plac、PtetA、Pλ及其相應(yīng)的調(diào)控元件LacI,TetR,λCI為基礎(chǔ)建立的。他們模擬二進(jìn)制的邏輯線路來(lái)研究表型的變化,即通過(guò)2個(gè)化合物的“輸入”,檢測(cè)一個(gè)熒光蛋白的“輸出”。通過(guò)熒光蛋白的檢測(cè)表征細(xì)胞表型的變化。通過(guò)改變模型中代謝網(wǎng)絡(luò)的連接點(diǎn),可以檢測(cè)到細(xì)胞各種不同的功能變化。組合合成技術(shù)為生物代謝網(wǎng)絡(luò)的研究提供了一個(gè)很好的方法,該方法不但快捷高效,而且實(shí)現(xiàn)了生物有機(jī)體活體的實(shí)時(shí)表型檢測(cè)。
盡管很多生物中一個(gè)特定基因的敲除或過(guò)表達(dá)對(duì)代謝的影響研究很多,但很少有研究涉及生物中新的代謝通路的添加對(duì)生物本身代謝的影響。Isalan等[60]研究了生物中新的代謝通路的添加對(duì)生物代謝的影響。他們構(gòu)建了 598個(gè)重組的啟動(dòng)子 (包括調(diào)控區(qū)域),以其為基礎(chǔ)構(gòu)建了598個(gè)高拷貝的質(zhì)粒,將其轉(zhuǎn)化到野生型大腸桿菌中,結(jié)果發(fā)現(xiàn)宿主對(duì)大約95%的新加入的代謝系統(tǒng)具有免疫性,即新的代謝系統(tǒng)可存在于宿主中,但很少有新加入的代謝系統(tǒng)會(huì)影響宿主的生長(zhǎng)特性。而且他們還發(fā)現(xiàn),一些加入新的代謝通路的菌株較野生型的菌株在不同的選擇壓力下具有更好的適應(yīng)性,這表明菌株中新代謝通路的形成對(duì)菌株的進(jìn)化在一定程度上具有促進(jìn)作用,利于菌株適應(yīng)環(huán)境的變化。這對(duì)于研究細(xì)菌的進(jìn)化也有重要的意義。
以上是誘導(dǎo)型啟動(dòng)子的研究進(jìn)展和具體應(yīng)用。但誘導(dǎo)型啟動(dòng)子也存在一些缺陷,如有些誘導(dǎo)物價(jià)格昂貴;有些光照或溫度誘導(dǎo)的啟動(dòng)子在實(shí)際應(yīng)用中增加了工業(yè)生產(chǎn)的成本;有些誘導(dǎo)物具有毒性,增加了從產(chǎn)物中去除誘導(dǎo)物的難度,這時(shí)組成型啟動(dòng)子就成了很好的替代工具。
組成型啟動(dòng)子由于自主啟動(dòng)表達(dá)的特性,不需要外加誘導(dǎo)物或進(jìn)行額外操作,而且基因的表達(dá)大體恒定在同一水平上,不同細(xì)胞表達(dá)水平?jīng)]有明顯差異。這些特性使該類(lèi)啟動(dòng)子在具有經(jīng)濟(jì)價(jià)值化合物或藥物生產(chǎn)中起著重要的作用。通過(guò)改變啟動(dòng)子?10區(qū)或?35區(qū)的堿基序列或者2個(gè)區(qū)域之間的堿基數(shù),可以獲得一系列不同啟動(dòng)效率的組成型啟動(dòng)子[61-62]。但由于一個(gè)序列確定的組成型啟動(dòng)子的啟動(dòng)效率是一定的,這限制了它的應(yīng)用,比如其啟動(dòng)效率無(wú)法人為調(diào)控,在一些異源的對(duì)宿主有毒害的蛋白表達(dá)中就受到限制,因?yàn)檫@類(lèi)啟動(dòng)子在宿主生長(zhǎng)初期就啟動(dòng)異源基因的表達(dá),很可能導(dǎo)致菌株死亡;另外,如果啟動(dòng)子的啟動(dòng)效率較高,會(huì)導(dǎo)致宿主的生長(zhǎng)壓力過(guò)大,極大影響菌體的生長(zhǎng),這限制了組成型啟動(dòng)子在生物催化領(lǐng)域的應(yīng)用。
細(xì)菌啟動(dòng)子在基因轉(zhuǎn)錄水平的調(diào)控上起著重要作用,直接決定蛋白的表達(dá)水平,用啟動(dòng)子構(gòu)建各種表達(dá)載體,可以在宿主中方便地表達(dá)外源基因;通過(guò)啟動(dòng)子的插入、缺失,或者構(gòu)建的載體轉(zhuǎn)化宿主細(xì)胞,可以有效改變或調(diào)節(jié)細(xì)菌的代謝,方便地獲得目的產(chǎn)物,或者降解不同的化合物,這使得細(xì)菌啟動(dòng)子在全細(xì)胞催化和酶催化領(lǐng)域具有巨大的應(yīng)用價(jià)值。隨著基因組測(cè)序技術(shù)和生物信息學(xué)的飛速發(fā)展,越來(lái)越多的細(xì)菌基因組被測(cè)序,在啟動(dòng)子已有的研究基礎(chǔ)上,根據(jù)啟動(dòng)子固有的特征,通過(guò)啟動(dòng)子識(shí)別技術(shù),可以很方便地進(jìn)行細(xì)菌啟動(dòng)子的識(shí)別,使更多不同啟動(dòng)效率和不同宿主范圍的啟動(dòng)子被發(fā)現(xiàn)并得到應(yīng)用,這為全細(xì)胞催化和酶催化提供了更多的材料,推動(dòng)了生物催化技術(shù)的發(fā)展。特別是啟動(dòng)子改造 (建立在啟動(dòng)子核心區(qū)域關(guān)鍵位點(diǎn)對(duì)啟動(dòng)子啟動(dòng)效率研究基礎(chǔ)之上[63]) 和啟動(dòng)子合成技術(shù)[64]的建立,為獲得研究所需要的啟動(dòng)子提供了方便,這必將推動(dòng)啟動(dòng)子的研究和應(yīng)用,而啟動(dòng)子的研究和應(yīng)用必將為生物催化帶來(lái)巨大變革。
REFERENCES
[1] Keasling JD. Synthetic biology for synthetic chemistry. Acs Chem Biol, 2008, 3(1): 64–76.
[2] Lin CJ, Peng CC, Lee CY. Prediction of RNA polymerase binding sites using purine-pyrimidine encoding and hybrid learning methods. Int J Appl Sci Eng, 2004, 2: 177–188.
[3] O'Neill MC. Escherichia coli promoters. I. Consensus as it relates to spacing class, specificity, repeat substructure, and three-dimensional organization. J Biol Chem, 1989, 264(10): 5522–5530.
[4] Harley CB, Reynolds RP. Analysis of E. coli promoter sequences. Nucleic Acids Res, 1987, 15(5): 2343–2361.
[5] Estrem ST, Ross W, Gaal T, et al. Bacterial promoter architecture: subsite structure of UP elements and interactions with the carboxy-terminal domain of the RNA polymerase alpha subunit. Genes Dev, 1999, 13(16): 2134–2147.
[6] Ross W, Gosink KK, Salomon J, et al. A third recognition element in bacterial promoters: DNA binding by the alpha subunit of RNA polymerase. Science, 1993, 262(5138): 1407–1413.
[7] Ozoline ON, Deev AA, Arkhipova MV, et al. Proximal transcribed regions of bacterial promoters have a non-random distribution of A/T tracts. Nucleic Acids Res, 1999, 27(24): 4768–4774.
[8] Mitchel J, Zheng D, Busby S, et al. Identification and analysis of extended -10 promoters in Escherichia coli. Nucleic Acids Res, 2003, 31(16): 4689–4695.
[9] Browning DF, Busby SJ. The regulation of bacterial transcription initiation. Nat Rev Microbiol, 2004, 2: 57–65.
[10] Travers AA, Burgess RR. Cyclic re-use of the RNA polymerase sigma factor. Nature, 1969, 222: 537–540.
[11] Gruber TM, Gross CA. Multiple sigma subunits and the partitioning of bacterial transcription space. Annu Rev Microbiol, 2003, 57: 441–466.
[12] Murakami K, Masuda S, Campbell EA, et al. Structural basis of transcription initiation: an RNA polymerase holoenzyme/DNA complex. Science, 2002, 296: 1285–1290.
[13] Merrick MJ. In a class of its own—the RNA polymerase sigma factor σ54(σN). Mol Microbiol, 1993, 10: 903–909.
[14] Gardan R, Rapoport G, Debarbouille M. Role of the transcriptional activator RocR in the arginine-degradation pathway of Bacillus subtilis. Mol Microbiol, 1997, 24: 825–837.
[15] Debarbouille M, Verstraete IM, Kunst F, et al. The Bacillus subtilis sigL gene encodes an equivalent of σ54from gram-negative bacteria. Proc Natl Acad Sci USA, 1991, 88: 9092–9096.
[16] Buck M, Gallegos MT, Studholme DJ, et al. The bacterial enhancer-dependent σ54(σN) transcription factor. J Bacteriol, 2000, 182(15): 4129–4136.
[17] Wang L, Gralla JD. Multiple in vivo roles for the 212-region elements of sigma 54 promoters. J Bacteriol, 1998, 180: 5626–5631.
[18] Buck M, Miller S, Drummond M, et al. Upstream activator sequences are present in the promoters of nitrogen-fixation genes. Nature, 1986, 320: 374–378.
[19] Feklistov A, Darst SA. Promoter recognition by bacterial alternative σ factors: the price of high selectivity? Genes Dev, 2009, 23(20): 2371–2375.
[20] Kanhere A, Bansal M. Structural properties of promoters: similarities and differences between prokaryotes and eukaryotes. Nucleic Acids Res, 2005, 33(10): 3165–3175.
[21] McAllister CF, Achberger EC. Effect of polyadeninecontaining curved DNA on promoter utilization in Bacillus subtilis. J Biol Chem, 1988, 263(24): 11743–11749.
[22] Jose PM, Rojo F, Lorenzo DV. Promoters responsive to DNA bending: a common theme in prokaryotic gene expression. Microbiol Rev, 1994, 58(2): 268–290.
[23] Plaskon RR, Wartell RM. Sequence distributions associated with DNA curvature are found upstream of strong E. coli promoters. Nucleic Acids Res, 1987, 15(2): 785–796.
[24] Kanhere A, Bansal M. Bansal M. A novel method for prokaryotic promoter prediction based on DNA stability. BMC Bioinformatics, 2005, 6: 1. doi:10.1186/1471-2105-6-1.
[25] Wang H, Benham CJ. Promoter prediction and annotation of microbial genomes based on DNA sequence and structural responses to superhelical stress. BMC Bioinformatics, 2006, 7: 248. doi:10.1186/1471-2105-7-248.
[26] Towsey M, Hogan JM. The in silico prediction of promoters in bacterial genomes. Genome Inform, 2007, 19: 178–189.
[27] Jacques PE, Rodrigue S, Gaudreau L, et al. Detection of prokaryotic promoters from the genomic distribution of hexanucleotide pairs. BMC Bioinformatics, 2006, 7: 423. doi:10.1186/1471-2105-7-423
[28] Gordon L, Chervonenkis AY, Gammerman AJ, et al. Genome-wide prokaryotic promoter recognition based on sequence alignment kernel//Berthold MR, Lenz HJ, Bradley E, et al eds. Advances in Intelligent Data Analysis V, Berlin: Springer Press, 2003: 386–396.
[29] Horton PB, Kanehisa M. An assessment of neural network and statistical approaches for prediction of E. coli promoter sites. Nucleic Acids Res, 1992, 20(16): 4331–4338.
[30] Pedersen AG, Baldi P, Brunak S, et al. Characterization of prokaryotic and eukaryotic promoters using hidden Markov models. Proc Int Conf Intell Syst Mol Biol, 1996, 4: 182–191.
[31] Tavares LG, Lopes HS, Lima CRE. A comparative study of machine learning methods for detecting promoters in bacterial DNA sequences//Huang DS, Wunsch DC, Levine DS, et al eds. Advanced Intelligent Computing Theories and Applications. With Aspects of Artificial Intelligence, Springer Berlin / Heidelberg Press, 2008: 959–966.
[32] Du YH, Wu TH. A novel method of prokaryotic promoter regions prediction with feature selection: quadratic discriminant analysis approach. Apcmbe 2008: 7th Asian-Pacific Conference on Medical and Biological Engineering, 2008, 19: 608–614.
[33] Reis AN, Lemke N. An improved hidden Markov model methodology to discover prokaryotic promoters//Bazzan ALC, Craven M, Martins NF, eds. Advances in Bioinformatics and Computational Biology. Springer Berlin/Heidelberg Press, 2005: 85–94.
[34] Dekhtyar M, Morin A, Sakanyan V. Triad pattern algorithm for predicting strong promoter candidates in bacterial genomes. BMC Bioinformatics, 2008, 9: 233 doi:10.1186/1471-2105-9-233.
[35] Nakano MM, Lin A, Zuber CS, et al. Promoter recognition by a complex of Spx and the C-terminal domain of the RNA polymerase alpha subunit. Plos One, 2010, 5(1): e8664. doi:10.1371/journal.pone.0008664.
[36] Dickson RC, Abelson J, Barnes WM, et al. Genetic regulation: the Lac control region. Science, 1975, 187(4171): 27–35.
[37] Amann E, Brosius J, Ptashne M. Vectors bearing a hybrid trp-lac promoter useful for regulated expression of cloned genes in Escherichia coli. Gene, 1983, 25(2-3): 167–178.
[38] Boer HA, Comstock LJ, Vasser M. The tac promoter: a functional hybrid derived from the trp and lac promoters. Proc Natl Acad Sci USA, 1983, 80(1): 21–25.
[39] Brosius J, Erfle M, Storella J. Spacing of the -10 and -35 regions in the tac promoter. Effect on its in vivo activity. J Biol Chem, 1985, 260(6): 3539–3541.
[40] Studier FW, Moffatt BA. Use of bacteriophage T7 RNA polymerase to direct selective high-level expression of cloned genes. J Mol Biol, 1986, 189(1): 113–130.
[41] Grossman TH, Kawasaki ES, Punreddy SR, et al. Spontaneous cAMP-dependent derepression of gene expression in stationary phase plays a role in recombinant expression instability. Gene, 1998, 209(1/2): 95–103.
[42] Dubendorff JW, Studier FW. Controlling basal expression in an inducible T7 expression system by blocking the target T7 promoter with lac repressor. J Mol Biol, 1991, 219(1): 45–59.
[43] Karine BS, Leblon G, Reyes O. Positively regulated expression of the Escherichia coli araBAD promoter in Corynebacterium glutamicum. FEMS Microbiol Lett, 1999, 174(1): 125–130.
[44] Newman JR, Fuqua C. Broad-host-range expression vectors that carry the L-arabinose-inducible Escherichia coli araBAD promoter and the araC regulator. Gene, 1999, 227(2): 197–203.
[45] Smolke CD, Martin VJJ, Keasling JD. Controlling the metabolic flux through the carotenoid pathway using directed mRNA processing and stabilization. Metab Eng, 2001, 3(4): 313–321.
[46] Soisson SM, Beth MS, Schleif R, et al. Structural basis for ligand-regulated oligomerization of AraC. Science, 1997, 276(5311): 421–425.
[47] Siegele DA, Hu JC. Gene expression from plasmids containing the araBAD promoter at subsaturating inducer concentrations represents mixed populations. Proc Natl Acad Sci USA, 1997, 94(15): 8168–8172.
[48] Haldimann A, Daniels LL, Wanner BL. Use of new methods for construction of tightly regulated arabinose and rhamnose promoter fusions in studies of the Escherichia coli phosphate regulon. J Bacteriol, 1998, 180(5): 1277–1286.
[49] Bhende PM, Egan SM. Genetic evidence that transcription activation by RhaS involves specific amino acid contacts with sigma 70. J Bacteriol, 2000, 182(17): 4959–4969.
[50] Holcroft CC, Egan SM. Roles of cyclic AMP receptor protein and the carboxyl-terminal domain of the alpha subunit in transcription activation of the Escherichia coli rhaBAD operon. J Bacteriol, 2000, 182(12): 3529–3535.
[51] Skerra A. Use of the tetracycline promoter for the tightly regulated production of a murine antibody fragment in Escherichia coli. Gene, 1994, 151(1/2): 131–135.
[52] Korpela MT, Kurittu JS, Karvinen JT, et al. A recombinant Escherichia coli sensor strain for the detection of tetracyclines. Anal Chem, 1998, 70(21): 4457–4462.
[53] Gallegos MT, Williams PA, Ramos JL. Transcriptional control of the multiple catabolic pathways encoded on the TOL plasmid pWW53 of Pseudomonas putida MT53. J Bacteriol, 1997, 179(16): 5024–5029.
[54] Yen KM, Gunsalus IC. Regulation of naphthalene catabolic genes of plasmid NAH7. J Bacteriol, 1985, 162(3): 1008–1013.
[55] Lee SK, Newman JD, Keasling JD. Catabolite repression of the propionate catabolic genes in Escherichia coli and Salmonella enterica: evidence for involvement of the cyclic AMP receptor protein. J Bacteriol, 2005, 187(8): 2793–2800.
[56] Lee SK, Keasling JD. A propionate-inducible expression system for enteric bacteria. Appl Environ Microbiol, 2005, 71(11): 6856–6862.
[57] De Smet L, Kostanjevecki V, Guisez Y, et al. A novel system for heterologous expression of flavocytochrome c in phototrophic bacteria using the Allochromatium vinosum rbcA promoter. Arch Microbiol, 2001, 176(1/2): 19–28.
[58] Anderson JC, Voigt CA, Arkin AP. Environmental signal integration by a modular AND gate. Mol Syst Biol, 2007, 3: doi: 10.1038/msb4100173.
[59] Guet CC, Elowitz MB, Hsing W, et al. Combinatorial synthesis of genetic networks. Science, 2002, 296(5572): 1466–1470.
[60] Isalan M, Lemerle C, Michalodimitrakis K, et al. Evolvability and hierarchy in rewired bacterial gene networks. Nature, 2008, 452(7189): 840–845.
[61] Jensen PR, Hammer K. The sequence of spacers between the consensus sequences modulates the strength of prokaryotic promoters. Appl Environ Microbiol, 1998, 64(1): 82–87.
[62] Jensen PR, Hammer K. Artificial promoters for metabolic optimization. Biotechnol Bioeng, 1998, 58(2/3): 191–195.
[63] Patwardhan RP, Lee C, Litvin O, et al. High-resolution analysis of DNA regulatory elements by synthetic saturation mutagenesis. Nat Biotechnol, 2009, 27(12): 1173–1175.
[64] Ruth C, Glieder A. Perspectives on synthetic promoters for biocatalysis and biotransformation. Chembiochem, 2010, 11(6): 761–765.
Bacterial promoter recognition and application
Youqiang Xu1, Cuiqing Ma1, Fei Tao2, and Ping Xu2
1 State Key Laboratory of Microbial Technology, Shandong University, Jinan 250100, China
2 MOE Key Laboratory of Microbial Metabolism, Shanghai Jiao Tong University, Shanghai 200240, China
Bacterial promoter is a kind of regulators which are needed in bacterial gene expression and decide the strength and opportunity of gene expression. By insertion or deletion of promoters, we can change bacterial gene expression in order to study the growth and metabolic regulation. Promoters are also used to construct many kinds of vectors, so as to express heterologous genes. The study of promoter recognition and application is of great importance to realize the regulation of genes, gain products effectively and promote biological catalysis and metabolic engineering. This paper reviews bacterial promoters, and the methods for recognition of bacterial promoters as well as the study and application of bacterial promoters.
promoter recognition, inducible promoter, promoter application
細(xì)菌的基因表達(dá)調(diào)控主要發(fā)生在轉(zhuǎn)錄水平上,而啟動(dòng)子在轉(zhuǎn)錄水平調(diào)控中居于關(guān)鍵的地位[1]。隨著生物催化技術(shù)的發(fā)展,細(xì)菌啟動(dòng)子獲得了越來(lái)越多的應(yīng)用。利用啟動(dòng)子可以改造細(xì)菌的代謝通路,或者方便地表達(dá)目的蛋白,使其在全細(xì)胞催化和酶催化中應(yīng)用廣泛,在生物催化中占有重要地位。而且該方法與物理法或化學(xué)法相比,還具有生產(chǎn)流程簡(jiǎn)單、底物的利用效率高、副產(chǎn)物少等特點(diǎn),降低了產(chǎn)物后處理的成本,在可持續(xù)發(fā)展中具有重要的意義。
May 24, 2010; Accepted: August 11, 2010
Supported by:National Natural Science Foundation of China (No. 30770064), National High Technology Research and Development Program of China (863 Program) (No. 2007AA10Z401), National Basic Research Program of China (973 Program) (No. 2007CB707803).
Cuiqing Ma. Tel: +86-531-88364003; Fax: +86-531-88369463; E-mail: macq@sdu.edu.cn
國(guó)家自然科學(xué)基金 (No. 30770064),國(guó)家高技術(shù)研究發(fā)展計(jì)劃 (863計(jì)劃) (No. 2007AA10Z401),國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃 (973計(jì)劃) (No. 2007CB707803) 資助。