王葉 賈振華 宋水山
(1. 河北工業(yè)大學化工學院,天津 300131;2. 河北省科學院生物研究所,石家莊 050000)
以往,工業(yè)生產(chǎn)中主要利用化學催化劑進行工業(yè)產(chǎn)品的生產(chǎn),對條件要求苛刻,且污染環(huán)境嚴重。生物催化劑是具有催化作用的游離或固定化細胞和游離或固定化酶的統(tǒng)稱。由于其反應條件溫和,綠色、安全,因此被廣泛應用于工業(yè)、農(nóng)業(yè)、醫(yī)藥和能源等領域。目前,生物催化劑的市場價值約40億美元,并且酶類的使用范圍仍在不斷的擴大[1],其中腈水解酶、蛋白酶、脂肪酶[2]、轉(zhuǎn)氨酶和糖基水解酶的研究受到了廣泛的關注。隨著科技的進步,工業(yè)生產(chǎn)中對酶的催化性能及耐受性提出了更高的要求。這就需要我們開發(fā)新的生物技術去尋求新型催化劑。
傳統(tǒng)的挖掘新型生物催化劑的方法主要基于可培養(yǎng)微生物的功能篩選,然后對陽性菌株進行序列分析,功能驗證。人們利用傳統(tǒng)的挖掘方法發(fā)現(xiàn)了淀粉酶[3]和酯酶[4]等。其中微生物作為催化劑的來源[5]在該方法中起著核心作用。據(jù)統(tǒng)計,地球上微生物細胞的總數(shù)達1030[6]。但是,大多數(shù)微生物存在于其天然微生物群落環(huán)境中,與其他微生物相互依賴而生存,很難在實驗室條件下進行純培養(yǎng)[7]。這極大地限制了傳統(tǒng)方法挖掘新型酶的效率。宏基因組學通過直接從環(huán)境樣品中提取全部微生物的DNA,構(gòu)建宏基因組文庫,利用基因組學的研究策略研究環(huán)境樣品所包含的全部微生物的遺傳組成及其群落功能[8],避免了微生物的分離和實驗室培養(yǎng),成為探索生物學和不同自然環(huán)境中分子生物多樣性的有力工具。而宏基因組學基因挖掘策略中也存在一些限制,可通過合成生物學來彌補。通過這兩種方法的結(jié)合使用,可以提高挖掘新型生物催化劑的效率,而宏基因組學基因挖掘策略中也存在一些限制,可通過合成生物學來彌補。通過這兩種方法的結(jié)合使用,可以提高挖掘新型生物催化劑的效率.本文綜述了宏基因組學方法挖掘新型生物催化劑的最新研究進展,并對利用合成生物學方法改進宏基因組篩選新型生物催化劑的效率進行了討論。從而探索提高挖掘新型生物催化劑的方法。
宏基因組學挖掘新型生物催化劑的基本流程(圖1):(1)采集樣品:微生物的生存環(huán)境與其所表達的酶的耐受性及底物特異性具有一致性,可通過所要篩選的生物催化劑的特性尋求合適環(huán)境中的微生物群體進行采樣。目前微生物樣品的來源大致可歸結(jié)為5大類:陸地環(huán)境、水生環(huán)境、寄生環(huán)境、人工環(huán)境及其他特殊環(huán)境。(2)提取特定環(huán)境中的基因組DNA:一般可分為直接提取法和間接提取法??筛鶕?jù)樣品來源微生物的特性及目的催化劑的特性進行優(yōu)化及選擇來提取環(huán)境總DNA。(3)構(gòu)建宏基因組文庫:所提取的基因組DNA需要連接到合適的載體中并轉(zhuǎn)化宿主菌。(4)篩選陽性克隆子:根據(jù)目的基因的活性或其序列特點進行宏基因組文庫的篩選。(5)目的基因的亞克隆和表達:將篩選到的目的基因連入合適的表達載體和宿主菌中表達。(6)目的催化劑的生化特性分析[9]:誘導目的基因表達,純化目的蛋白,并作生化特性分析。[10]。近年來,人們已經(jīng)成功利用宏基因組學發(fā)現(xiàn)在工業(yè)應用中具有潛在利用價值的酶[5,11]。宏基因組學挖掘新型生物催化劑包括基于活性的篩選和基于序列的篩選。
圖1 宏基因組學挖掘新型生物催化劑流程圖
基于活性的篩選(Activity-based screening),也稱功能驅(qū)動篩選(Function-driven screening),是指通過活性檢測手段從基因組文庫中獲得具有特殊活性的克隆方法[9]。基于活性的篩選是在沒有任何核苷酸、核糖核苷酸或蛋白質(zhì)序列分析的情況下,直接對基因潛在功能的篩選。因此,為了有效地從潛在基因(含有潛在功能基因片段的克隆或具有相應表型的菌株)中發(fā)現(xiàn)新型催化劑,需要建立合適的功能篩選方法。這些方法最好簡單易行,如通過肉眼直接觀察或用分光光度計檢測來鑒別陽性克隆[12]。通常在固體培養(yǎng)基中添加特殊底物,經(jīng)過微生物代謝,引起比色變化,透明圈、抑菌圈或生長表型的變化,從而來篩選陽性克隆。本實驗室在篩選能將異丁酸合成β-羥基異丁酸菌株時,將菌株培養(yǎng)于以異丁酸為唯一碳源的培養(yǎng)基中,能進行生長的為陽性克隆。在添加特殊底物的液體培養(yǎng)基中,可將細胞或細胞裂解液置于96孔板中,通過分光光度計測量其吸光度的變化來鑒別陽性克隆。最后,利用分子生物學工具和生物體內(nèi)蛋白調(diào)控的知識來挖掘新型酶。近年來有很多利用這種方法成功挖掘具有新型功能的生物催化劑[13-15]的例子。
脂肪酶和酯酶作為生物催化劑,被廣泛應用于紡織、食品、洗衣、造紙和紙漿工業(yè)、生物柴油生產(chǎn)和精細化學品的合成等領域。Chu等[16]從中國南海取樣,構(gòu)建宏基因組文庫。以1%三丁酸甘油酯和1%阿拉伯樹膠為底物,篩選出周圍帶透明圈的陽性菌落。進一步用BamHⅠ內(nèi)切酶隨機消化陽性菌落質(zhì)粒DNA,構(gòu)建帶有隨機片段的克隆子,分離出兩種新型酯酶estA和estB。同樣,李云娣等[17]在含有1%三丁酸甘油酯的培養(yǎng)平板上,37℃培養(yǎng)3-5 d 后觀察產(chǎn)生透明圈的陽性克隆子,發(fā)現(xiàn)了酯酶ESTYN1[17]。Wierzbicka-Wo?等[18]篩選出新型冷活性糖苷水解酶(BglMKg)。在這項研究中,在固體培養(yǎng)基中添加X-gal,陽性克隆將會變?yōu)樯钏{色,從而篩選出具有新型冷活性糖苷水解酶的菌落。另外作者還用不同的發(fā)色底物檢驗了酶的特殊活性。
如前所述,基于活性篩選的方法已經(jīng)建立并成功運用,但有些種類的催化劑還沒找到合適的功能篩選方法。因此,利用工業(yè)相關底物去尋求理想新型(底物特異性、手性、酶活穩(wěn)定性)催化劑的智能篩選方法仍是我們現(xiàn)在面臨的巨大挑戰(zhàn)。但這并不是說通用底物在功能篩選中沒有作用。解決這一問題的關鍵是全面重新審視并詮釋新型酶的特征,并選擇合適的生化檢測實驗來驗證陽性克隆。
基于序列的篩選是以序列相似性為基礎,根據(jù)已知相關功能基因的保守序列設計探針或PCR 引物[19],然后通過雜交或PCR 擴增來篩選目標克?。?],這兩種方法都不需要異源宿主細胞中的蛋白表達[20]。當然,其隨后的功能表達仍需面臨蛋白表達的問題,但是在篩選階段可以避免這些限制,降低了由異源表達效率低而造成的假陰性。近年來利用此種方法已成功挖掘許多新型催化劑。
梁躍斌等[21]對CAZy數(shù)據(jù)庫中193條細菌源α-L-鼠李糖苷酶進行氨基酸序列分析[22],根據(jù)保守氨基酸序列設計簡并引物,對健康人體糞便宏基因組DNA[23]進行篩選,將獲得的基因片段進行測序,進而通過原核表達獲得新型α-L-鼠李糖苷酶基因。Jiang等[24]從北冰洋海水中取樣,構(gòu)建了一個質(zhì)粒宏基因組文庫,并篩選出新型延胡索酸酶基因fumF。另外,Wang等[25]在摩斯拉熱液噴口處采樣并對構(gòu)建的宏基因組文庫進行隨機焦磷酸測序,篩選出糖苷水解酶(GH-57)。Fang等[26]通過保守區(qū)域-銅結(jié)合位點對中國南海微生物宏基因組文庫進行分析,篩選出一長1.32 kb的細菌漆酶基因。
從2009年到2015年宏基因組測序項目從199個增長到607個,同時在GOLD 網(wǎng)站上有22 455條非宏基因組研究條目。巨大的測序數(shù)據(jù)庫為探索特定酶活性的基因奠定了基礎。盡管如此,這種方法還是具有其局限性,尤其是新穎性。該方法依賴于數(shù)據(jù)庫中已知的序列,僅限于同源酶的分析[27]。迄今為止,新發(fā)現(xiàn)的酶的氨基酸序列與數(shù)據(jù)庫中已存在的序列同源性高于50%,一般在70%-90%之間,脂肪類酶除外[28]。因此,同源性低于這個范圍的新型酶需要利用其他方法進行篩選,如可采用功能篩選或提高預測軟件識別區(qū)域結(jié)構(gòu)的能力。
隨著注解多樣性的增加,利用同源性搜索,我們可以挖掘更具新穎性的基因序列。不管它是否轉(zhuǎn)錄為具有新功能的酶還是只具備之前被定義的活性,這種預篩選都是有意義的。雖然目前的篩選方法可以分離新序列,尤其是脂肪酶類序列,但并沒有表現(xiàn)出篩選新穎功能酶的用途?;驒z測的發(fā)展和更復雜的注解程序可以實現(xiàn)這一功能?;蛘?,從宏基因組樣品中勘測到的具有新穎性的序列可以作為接下來分子操作的一個基礎。
如Handelsman等[29]所述,宏基因組可定義為“自然界中存在的所有微生物的基因組”,指的是從自然環(huán)境中可以直接得到的基因序列。雖然宏基因組學是不依賴于生物培養(yǎng)的獲取有價值基因資源的有效方法[16]。但其仍然存在局限性,其具體主要歸納為以下3個方面。首先,挖掘的新型基因需要在異源宿主細胞中進行表達,而各個菌屬的菌株在轉(zhuǎn)錄、翻譯等過程中都具有偏好性(RNA聚合酶對啟動子的識別,密碼子、核糖體識別等),這就需要提高基因在異源宿主菌中表達目的酶的能力。其次,載體與宿主菌常存在不兼容問題,需要開發(fā)新的遺傳工具以改善宏基因組文庫的構(gòu)建,使其適合不同宿主的篩選。最后,需要繼續(xù)完善篩選方法,從而提高挖掘新型催化劑的效率。以自然環(huán)境為資源,將迎來更強大有效的探索龐大基因組潛能工具的熱潮。
合成生物學在現(xiàn)代生物學基礎上融入了工程學思想。它將化學或生物化學合成的DNA生物元件構(gòu)建為標準化的元件庫,并利用這些元件組裝成具有全新特征或增強了性能的生物模塊、網(wǎng)絡、體系乃至生物體(細胞),以滿足人類的需求[30]。其中元件指具有特定功能的DNA片段(如基因),模塊指多個元件的組合[31]。它主要包括兩種技術線路:(1)利用標準化元件設計和建造模塊、體系。(2)在天然的代謝網(wǎng)路基礎上,利用標準化原件對其進行改造。合成生物學使得基因網(wǎng)路能像電路一樣,通過控制各個元件,來調(diào)控功能的表達。利用此特點可以很好的解決上面提出的宏基因組篩選策略中遇到的3類問題。
通過宏基因組學篩選出的陽性克隆子,需要進行目的基因的亞克隆、表達、純化,才能對目的催化劑的生化特性進行分析。由于目的基因的來源菌株與異源表達宿主菌株系統(tǒng)發(fā)育的不同,可能導致異源基因表達失敗或低表達,造成宏基因組文庫中所需酶回收率低[11,32]。合成生物學可以解決這一難題。轉(zhuǎn)錄初始階段,由于原核生物中RNA聚合酶對啟動子的識別具有很大的偏好性[33],使得宿主體內(nèi)的RNA聚合酶與宏基因組中的啟動子親和力低成為蛋白異源表達的主要限制。蛋白質(zhì)異源表達理想的的宿主菌應該具有識別廣譜啟動子的能力??梢酝ㄟ^插入特定啟動子及其σ因子等元件在宿主菌中共表達來實現(xiàn)[34-35]。另外可以利用T7 RNAP表達模塊系統(tǒng)實現(xiàn)異源蛋白的高效表達[36],而且這種方法可以使受復雜信號轉(zhuǎn)導機制的基因僅僅通過添加單一誘導物如異丙基-β-D-硫代吡喃半乳糖苷而被誘導表達。同理,在mRNA翻譯過程中,核糖體結(jié)合位點的差異性也會導致蛋白表達水平的降低[37]。因此同時也需共表達mRNA識別步驟中的蛋白,從而增強宿主菌表達外源基因的能力[38]。然而這些都只是為了提高目的蛋白的表達水平,表達出來蛋白是否有活性是開發(fā)新型催化劑的另一個關鍵因素。表達出來的蛋白需要進行復雜折疊或通過額外的處理步驟(如切割、分泌或肽修飾)形成正確的構(gòu)象[39]。例如,F(xiàn)errer等[40]在大腸桿菌中將目的蛋白與分子伴侶[41]共表達,使得異源蛋白正確的折疊。
在提高異源宿主能力的方法中基因編輯尤其受到了關注[42]。因為在標準的試驗條件下目的基因并不是宿主菌(如大腸桿菌)生長所必需的[43],兼容這些基因并大量表達其編碼的蛋白意味著巨大的能量消耗和代謝負擔[44]。刪除非必需基因,減小基因組大小,提高細菌代謝活力,可以提高異源蛋白的表達水平[45]。擁有最小化基因組的細菌,由于其超強的表達能力,成為篩選宏基因組文庫最理想的宿主。
除了基因工程中最常用的宿主菌大腸桿菌外,在宏基因組篩選中人們還嘗試過其他菌株作為宿主菌來提高挖掘新酶的效率[46-47]。而在宿主細胞中的表達,需將目的基因整合入載體并導入宿主菌中,進行穩(wěn)定遺傳及表達,這就需要建立一個通用的、標準化、適合多種宿主菌的廣譜工具(載體),以促進各種宿主菌中宏基因組文庫的篩選??梢岳煤铣缮飳W,重新組裝元件,構(gòu)建新的基因網(wǎng)路[48-49],開發(fā)出適合多種宿主細胞的載體。在這些適合于多種宿主的工具中,pSEVA載體因可以廣泛應用于100多種不同的細菌種類而受到廣泛關注[50]??梢源讼到y(tǒng)為出發(fā)點,設計基因網(wǎng)路,開發(fā)新的遺傳工具,從而更高效的篩選不同種類細菌的DNA。2.3 合成生物學改善宏基因組篩選方法
目前常用來篩選宏基因組文庫中新型催化活性的方法??梢杂萌庋塾^測到。在固體培養(yǎng)基中添加特殊底物,陽性菌落周圍底物顏色發(fā)生變化[51-52]或底物被降解形成透明光圈[53]。勞動密集型篩選方法如菌落PCR也用于新型催化劑的挖掘[54]。利用合成生物學及生物學知識,通過合理整合調(diào)節(jié)網(wǎng)路的各個部分[55],設計生物傳感器,可以為酶活性的篩選提供更好的方案[56]。生物傳感器是將工程基因網(wǎng)路與已報道基因(lacZ、綠色熒光蛋白或螢光素酶等)的整合,通過簡單的表觀現(xiàn)象篩選陽性克隆,便于生物體內(nèi)鑒別酶活性的一種工具[57]。這種方法減少了篩選過程中大量的重復勞動,極大的提高了宏基因組文庫的篩選效率。合成生物學也可以通過生物合成途徑調(diào)節(jié)酶分子水平。Zelcbuch 等[37]通過與核糖體結(jié)合位點結(jié)合配對基因來調(diào)節(jié)酶表達的水平,引起蛋白種類幾個數(shù)量級的變化,這表明工程代謝途徑受酶水平的精確調(diào)控。這些例子表明可以通過合成生物學方法,關聯(lián)各調(diào)控因子(如啟動子和調(diào)節(jié)子),設計出具有更好性能的酶的基因網(wǎng)路。以基因工程網(wǎng)路中各調(diào)控元件為基礎重新設計調(diào)節(jié)系統(tǒng),并將其應用于挖掘新型催化劑策略中,將會極大提高挖掘新型催化劑的速率。
新型催化劑在工業(yè)中已受到廣泛應用,宏基因組篩選策略挖掘新型催化劑將會推動下一代工業(yè)流程如生物藥物的合成并開創(chuàng)新的機遇。這就要求生物技術的全面綜合發(fā)展。從基因序列角度來看,隨著宏基因組多樣性的增加及基因分離、測序技術的發(fā)展,宏基因組篩選策略已經(jīng)開始著手挖掘序列同源性較低的基因,并將推動基于序列的新型催化劑的挖掘。可以將所有原核微生物的宏基因組進行測序[58],為宏基因組學法挖掘新型生物催化劑奠定基礎,并為生物技術的發(fā)展提供數(shù)據(jù)參考。
構(gòu)建工程基因網(wǎng)路可以將合成生物學與編程相結(jié)合,它包括設計、建模、實施及調(diào)試等環(huán)節(jié)。例如開發(fā)一些電子設備分析生物系統(tǒng),在這里細胞可以被重新編程,從而以更高的效率執(zhí)行新的任務[59-60]。設計方面著重規(guī)劃和構(gòu)建新的基因網(wǎng)路以便于工業(yè)應用[61]。建模包括所提出的基因網(wǎng)路的計算機模擬,評估網(wǎng)路性能與能力并為其選擇合適的分子組分做指導[62]。實施部分包括根據(jù)組裝標準,對適當?shù)慕M分例如啟動子、調(diào)節(jié)元件、終止子、酶和轉(zhuǎn)運蛋白等進行機械組裝[48]。最后,調(diào)試步驟需要測試和驗證生物體內(nèi)代謝通絡,并且改善生物系統(tǒng)在應激情況中表現(xiàn)出來的對生產(chǎn)不利的特性[63-65]。目前已經(jīng)有設計并實施成功的生物通路的例子[64,66-67],并且近年來該領域的發(fā)展速度驚人[65,68]。
將宏基因組篩選策略[69]中各種方法結(jié)合起來,并與生物信息學測序能力,信息分析能力[70-73],智能篩選技術和合成技術[73]協(xié)同作用將會迎來生物學技術的巨大飛躍。為了實現(xiàn)這個目標并使其效能最大化,需要各領域的科學家們的協(xié)調(diào)配合。信息學、分子生物學、化學、藥物設計、物理學、工程學及系統(tǒng)生物學等學科學術與工業(yè)應用的融合發(fā)展,將會更好的應對未來的挑戰(zhàn),為生物催化劑及生物產(chǎn)物的發(fā)現(xiàn)提供廣闊的平臺。