徐杰 黃建忠 李力
(福建師范大學生命科學院,福州 350108)
與傳統(tǒng)的以“模型導向”科研方式不同,基因組學研究以其高度的系統(tǒng)性,以數(shù)據(jù)為導向,開創(chuàng)了全新的研發(fā)方法。20世紀以來高通量基因測序技術(shù)的建立直接推動了生物信息學的發(fā)展[1],微生物基因組測序的成本不斷降低,周期縮短,越來越多的生物遺傳信息被公布,公共數(shù)據(jù)庫積累了大量的基因組序列數(shù)據(jù),后基因組時代來臨[2]。在此基礎(chǔ)上,人們通過生物信息學軟件對不同基因結(jié)構(gòu)進行識別鑒定、功能分析、相互關(guān)系和可能的表達調(diào)控機制,發(fā)現(xiàn)了大量未知的可能與合成新型次級代謝產(chǎn)物相關(guān)的基因簇,這為直接以基因為導向替代傳統(tǒng)的以生物活性為導向,尋找潛在藥物提供了可能[3]。
生物體次級代謝產(chǎn)物是抗生素的主要來源,其頻繁的使用會加速細菌適應性進化而產(chǎn)生免疫能力。研究證實,在對某一藥物產(chǎn)生抗性的同時,細菌對其結(jié)構(gòu)類似物或衍生型藥物的抗藥性也會得到提高[4]。自 1979 年 Campbell[5]從 40000 份土壤樣品發(fā)現(xiàn)新型抗生素阿維菌素后至今的40年內(nèi),尚未找到其它有重要應用價值的活性化合物,以生物活性為導向的舊有藥物篩選方式陷入瓶頸。挖掘藥物的關(guān)鍵在于避免已知化合物的過度復篩,能否發(fā)現(xiàn)新藥物很大程度上取決于挖掘過程中在概率上的盲目程度。用科學理論指導開發(fā)方向,可降低成本和周期,避免已知化合物的重復研究。微生物中負責編碼次級代謝產(chǎn)物合成的酶基因通常成簇存在,通過NCBI中基礎(chǔ)局部比對搜索工具(BLAST)搜索相關(guān)酶類,并通過基因預測算法,如Augustus發(fā)現(xiàn)未知的生物合成基因簇,通過信息學工具可預測出產(chǎn)物結(jié)構(gòu)以及可能含有的新藥物作用靶點[6-8],這為新藥開發(fā)提供了新方向。
次級代謝產(chǎn)物是一種具有多樣化結(jié)構(gòu)的小分子,它在微生物體內(nèi)不是為了滿足機體基本生長需要而產(chǎn)生,而是作為一種“武器”來對抗復雜的生態(tài)環(huán)境并保證在與其它微生物的競爭中處于優(yōu)勢地位。然而編碼此類化合物的基因往往只在特定環(huán)境下才表達,常規(guī)培養(yǎng)條件下處于沉默狀態(tài)或表達量低,難以分離純化和投入工業(yè)生產(chǎn)。統(tǒng)計數(shù)據(jù)顯示微生物中表達并分離出對應代謝產(chǎn)物的合成基因只占總數(shù)的10%左右,微生物資源在新藥研發(fā)領(lǐng)域的潛力遠遠沒有被開發(fā)出來,還需要不斷地進行探索[9]?;蚪M挖掘是指通過高通量測序技術(shù)對生物信息學預測的可能編碼高價值天然產(chǎn)物的基因進行測序,了解基因表達翻譯的控制機制并通過一系列手段將其激活表達,分離純化出相應目的產(chǎn)物后解析結(jié)構(gòu)并進行生物活性測試的技術(shù)。與傳統(tǒng)方法相比它將整個過程簡化為編碼次級代謝產(chǎn)物基因序列數(shù)據(jù)在培養(yǎng)基上的變現(xiàn)及分離柱上的純化,讓整個流程處于分子生物學的指導[10],研究主要包含以下方向。
基因組學挖掘天然產(chǎn)物的關(guān)鍵在于尋找到有價值的合成基因,酶作為生物體內(nèi)代謝活動的催化劑在次級代謝產(chǎn)物合成途徑中發(fā)揮了重要作用,催化同一類型反應的酶系在分子結(jié)構(gòu)上具有保守性,核心往往有一個高度重復的氨基酸序列,直接以負責目的代謝產(chǎn)物的合成酶作為靶點,系統(tǒng)進化樹分析含有關(guān)聯(lián)序列的酶基因,設(shè)計交聯(lián)探針或PCR引物即可定向選擇具有合成潛力的基因。最典型的就是目前研究比較深入的聚酮化合物合酶(Polyketidesynthase,PKS)和非核糖體肽合酶(Nonribsomal peptide synthetases,NRPS), 其 分子結(jié)構(gòu)是由多個結(jié)構(gòu)單元組成,線性排列的負責相應結(jié)構(gòu)單元的模塊化合成酶基因組成了完整的生物合成基因簇。Sun等[11]對海洋黏細菌Haliangium ochraceum SMP-2進行基因組挖掘,發(fā)現(xiàn)了一種聚酮化合物-非核糖體肽雜合化合物Haliamide 1(圖1),通過核磁共振和HR-MS對結(jié)構(gòu)進行表征和喂養(yǎng)實驗發(fā)現(xiàn)其生物合成的結(jié)構(gòu)單元為苯甲氨酸鹽、丙氨酸和丙氨酸鹽,從而建立了鹵胺合成的生物模型,活性檢測發(fā)現(xiàn)對Hela-S3細胞具有毒性。
圖1 Haliamide 1結(jié)構(gòu)
比較基因組學是基于基因組圖譜和測序技術(shù),對已知基因和基因組結(jié)構(gòu)進行比較,了解基因功能、表達機理、物種進化的科學。在研究目的蛋白基因的同時,關(guān)注完整的基因簇或基因鄰域,分析不同分子間相關(guān)性來挖掘未知酶系和其體內(nèi)的生物合成機制,促進新化合物的發(fā)現(xiàn)。將已知基因序列的功能基因簇通過NCBI數(shù)據(jù)庫與其它已測序的生物遺傳圖譜進行局部共線性比對驗證是否具有類似的合成路徑,挖掘已知物種未發(fā)現(xiàn)的合成潛力。通過將編碼目標修飾蛋白的抗藥性基因與未表征次級代謝合成基因簇孤兒BGCs相關(guān)聯(lián),基因組定向挖掘的過程中,可預測路徑特異性小分子的生物學功能。Tang等[12]對86個鹽孢菌基因組的全基因組查詢,獲得與天然產(chǎn)物BGCs共定位的管家基因,篩選出一個可能具有脂肪酸合成酶抗性基因的PKS-NRPS雜合BGC(TLM),從而推測出硫代四酸類抗生素的合成途徑。
宏基因組是指環(huán)境中所有微生物遺傳物質(zhì)的總和,包含可培養(yǎng)和未可培養(yǎng)微生物遺傳物質(zhì)基因,通過構(gòu)建宏基因組文庫,繞過培養(yǎng)難點直接在基因?qū)哟窝芯课纯膳囵B(yǎng)微生物的合成潛力,可能會發(fā)現(xiàn)新的耐藥基因和抗生素機制,完善藥物靶點,以及鑒定在不同生長環(huán)境下對細菌、真菌生長起重要作用的基因,從而豐富基因庫來源[13]。操作包括從環(huán)境中提取樣品DNA,高通量測序后選擇合適的載體拼接修飾,導入宿主細胞激活表達,實現(xiàn)對基因組網(wǎng)絡(luò)的功能驗證與開發(fā)利用。Levin等[14]通過結(jié)合基因組學和生物學知識,將合成具有保守氨基酸結(jié)構(gòu)的蛋白質(zhì)基因和正常人體的消化道菌群數(shù)據(jù)進行對比,分析了甘氨酰自由基酶(GRE)家族,以甘氨酸為中心用自由基進行化學反應,確定了一個新的在生產(chǎn)L-脯氨酸通路上起重要作用的反式 4 羥基脯氨酸脫水酶,它在所有腸道微生物宏基因組樣本中都能發(fā)現(xiàn),從而揭示了反式 4 羥基 L 脯氨酸的常規(guī)代謝途徑。
通過基因組挖掘的方法能夠準確發(fā)現(xiàn)大量與合成次級代謝產(chǎn)物相關(guān)的基因簇,然而多數(shù)基因在常規(guī)培養(yǎng)條件下處于沉默狀態(tài),必須在特定生理環(huán)境下或外來細菌病毒入侵引起免疫應答機制時才會激活。這些基因由于常規(guī)條件下不表達,因而更有可能在人為控制下激活產(chǎn)生骨架新穎、生物活性高的次級代謝產(chǎn)物,如何選用適當?shù)姆椒せ钸@些“沉默代謝途徑”是繼基因組挖掘后的重要研究內(nèi)容,也是最終獲得潛在藥物資源的關(guān)鍵?,F(xiàn)階段激活沉默基因的策略如下。
通過改善培養(yǎng)基組分、溫度、pH、光照條件、氣壓、氧濃度、微量元素,或與合適病原菌、競爭菌共培養(yǎng),提高生存壓力刺激沉默基因表達。某些能夠改變微生物表觀遺傳途徑的小分子物質(zhì),如DNA甲基轉(zhuǎn)移酶抑制劑、組蛋白去乙?;种苿┠軌蛴绊慏NA甲基化、組蛋白修飾和RNA干擾等從而影響微生物對于次級代謝產(chǎn)物的合成調(diào)控,誘導沉默基因表達。Bode等[15]研究小組通過改變培養(yǎng)條件從6個微生物中分離出超過25個結(jié)構(gòu)類型的100多個化合物;Scherlach等[16]發(fā)現(xiàn)Aspergillusnidulans這種產(chǎn)生在水稻培養(yǎng)基但不產(chǎn)生在其它介質(zhì)中的新型喹諾林類生物堿;Shwab等[17]發(fā)現(xiàn)編碼黑曲霉組蛋白去乙?;福℉DAC)的hdaA缺失,導致兩個端粒近端基因簇的轉(zhuǎn)錄激活,隨后相應的分子(毒素和抗生素)水平增加。
次級代謝產(chǎn)物合成基因簇是復雜的,它不只是單純含有合成化合物的基因,同時還包含大量參與基因表達,控制代謝途徑的調(diào)節(jié)基因。通過設(shè)計方案對調(diào)節(jié)基因進行敲除、阻遏、或使其過表達,都會影響次級代謝產(chǎn)物的合成效率。選擇性過表達正調(diào)控因子和降低負調(diào)控因子表達減少反饋抑制可促進基因的激活和代謝產(chǎn)物在發(fā)酵液中的積累[18]。Laureti等[19]過表達Streptomyces ambofaciens中的特異性調(diào)節(jié)基因Sam R0484激活了一個沉默的聚酮合酶的次級代謝基因簇表達,最終得到了新型的具有抗腫瘤活性的化合物Stambomycins。Molloy等[20]通過滅活推測的TetR轉(zhuǎn)錄抑制因子 arPRII等手段對編碼化合物基因進行鑒定,質(zhì)譜和核磁共振光譜對產(chǎn)物進行結(jié)構(gòu)表征證實其是新的生物堿類化合物,生物活性測試發(fā)現(xiàn)對于黏菌的生長和菌落分化具有負面作用,其中一些抗菌活性較弱。
與微生物在營養(yǎng)缺陷時的應激機制相似,核糖體工程就是通過以不同的微生物抗性突變?yōu)榘袠?,高效獲得次級代謝產(chǎn)物合成能力得到提高的突變株的推理育種新方法。核糖體不僅是微生物體內(nèi)蛋白質(zhì)合成位點,還可以與藥物結(jié)合抑制蛋白質(zhì)合成從而調(diào)控次級代謝產(chǎn)物的合成途徑,如鏈霉素和氯霉素可分別與核糖體30S亞基和核糖體50S亞基結(jié)合。在微生物的穩(wěn)定生長期,與合成次級代謝產(chǎn)物相關(guān)基因的大量表達取決于此時的核糖體功能。以生物體中核糖體蛋白、RNA聚合酶RNAP、轉(zhuǎn)錄因子為作用靶點,通過在核糖體蛋白編碼基因上引入定點修飾和突變,改造核糖體結(jié)構(gòu)來改變相關(guān)催化酶的生物學性質(zhì),可能會激活相關(guān)沉默的抗生素合成基因,影響代謝途徑[21-23]。如 Dong等[24]通過核糖體技術(shù)使海洋真菌雜色曲霉菌ZBY3獲得耐新霉素抗性后發(fā)現(xiàn)6種新型抗腫瘤物質(zhì);Yi等[25]通過同樣手段在紫草青霉G59中分離到一種新的環(huán)戊酮硫化物。
異源表達一般指異源蛋白表達,對于具有復雜調(diào)控機制或不可培養(yǎng)微生物的基因,將目的合成基因簇整合插入到質(zhì)粒、黏粒、人工染色體等載體后在異源宿主內(nèi)表達。該方法可繞過自身復雜的調(diào)控機制,減少原有產(chǎn)物含量積累造成的反饋抑制和對特定表達環(huán)境的需求,對生長緩慢的菌種可明顯降低生產(chǎn)周期。目前用于挖掘新化合物的異源表達流程通常為:大腸桿菌擴增載體、酵母細胞對目的片段進行拼接、曲霉作為宿主細胞對目的基因進行表達[26]。啟動子是位于起始位點上游能增加或降低基因轉(zhuǎn)錄速率,被RNA聚合酶識別、結(jié)合和開始轉(zhuǎn)錄的一段DNA序列,它含有RNA聚合酶特異性結(jié)合和轉(zhuǎn)錄起始所需的保守序列,本身不被轉(zhuǎn)錄。在沉默基因簇前添加或替換誘導型或組成型啟動子,構(gòu)建新的調(diào)控機制,通常可刺激基因激活提高表達量,利于最終工業(yè)生產(chǎn),常見的有構(gòu)巢曲霉A的持家啟動子gpdA,黑曲霉作為宿主異源表達時的常用強啟動子glaA等[27-30]。Wang等[31]發(fā)現(xiàn)在工程大腸桿菌中表達編碼嗜熱鏈球菌雙功能谷胱甘肽合成酶基因GshF,分批發(fā)酵分離積累的GSH達到以往表達最高水平。黃開華等[32]利用蛹蟲草自身強啟動子,構(gòu)建天蠶菌素抗菌肽過表達載體,介導農(nóng)桿菌遺傳轉(zhuǎn)化系統(tǒng),在蛹蟲草中成功表達,活性測定和抑菌實驗表明相較于野生型其生物學活性明顯提高。Saha等[33]通過啟動子工程和異源表達對海洋鏈霉菌SCSIO02999中ptm基因簇進行激活,發(fā)現(xiàn)6種新的多環(huán)四酸酯大環(huán)酰胺PTMS,其對人癌細胞株具有較強細胞毒活性,體內(nèi)基因破壞實驗和體外生化實驗表明多循環(huán)形成一個還原環(huán)化級聯(lián),并證明PtmC是雙功能環(huán)化酶,可催化伊卡毒素內(nèi)五元環(huán)形成。
來源于真菌的天然產(chǎn)物具有廣泛的生物活性,然而其遺傳調(diào)控途徑相對細菌復雜,導致現(xiàn)階段對其研究較少。隨著高通量測序技術(shù)和生物信息學發(fā)展,對復雜微生物代謝通路進行分析的技術(shù)逐漸成熟,真菌作為尋找新穎骨架結(jié)構(gòu)和獨特作用機制藥物的重要來源,其生物醫(yī)藥價值受到眾多科學家的關(guān)注。真菌中次級代謝產(chǎn)物主要分為:萜類化合物、聚酮類化合物、生物堿、非核糖體肽、氨基酸衍生物、氨基酸/聚酮雜合體細胞松弛素等。目前已從真菌中獲得的藥物包括具有抑菌、抗腫瘤、抗炎和免疫調(diào)節(jié)功能的核苷酸類抗菌素蟲草菌素;藥用真菌靈芝中分離的抗氧化抗衰老、促進核酸蛋白質(zhì)代謝的靈芝多糖以及最經(jīng)典的青霉素(圖2-A)和頭孢菌素(圖2-B)等,研究還發(fā)現(xiàn)紅豆杉內(nèi)生真菌會合成毒性較小的廣譜抗腫瘤藥物紫杉醇(圖2-C)[34]。絕大多數(shù)真菌種類屬于尚未認知狀態(tài),近幾年對于真菌挖掘潛在藥物又有了新進展[35]。
Shu等[36]從青霉Penicilin Herquei中分離到新的重氮雜環(huán)辛烷衍生物和新戊二酮衍生物,進行生物活性測試發(fā)現(xiàn)具有抗丙型肝炎病毒(Human antiheptitis C virus,HCV)能力,這是首次報道具有抗HCV能力的重氮環(huán)辛烷衍生物(3-A)。Chiba等[37]在篩選新的抗流感病毒時,從真菌FKI-7215發(fā)酵液中分離出草甘氨酸A(Herquline A)(圖3-C),其對于流感病毒復制有劑量依賴性的抑制作用且對病毒神經(jīng)氨酸酶沒有抑制作用。Tansakul等[38]從土壤真菌黑曲霉(Penicillium herqueiPSURSPG93)中分離出新的苯丙烯酮衍生物和五個已知的phenalenone衍生物,其一個phnalenone衍生物對非洲綠猴腎成纖維細胞無細胞毒性,但抗氧化能力弱。Arunpanichlert等[39]在海草源真菌Pestalotiopsp中分離出4種新的代謝產(chǎn)物,包括2種巰基萜類、1種異香豆素和1種苯酚,提出了一種多烯類化合物的生物合成途徑并有較好的抗菌、抗瘧和細胞毒活性。Klaiklay等[40]從紅樹林真菌Pestalotitisp中分離到4種新的聯(lián)苯醚、3種新的色酮、1種新的黃酮、1種新的花椒酮、1種新的丁烯內(nèi)酯-Pestrolide(圖3-D)和11種已知化合物。光譜技術(shù)確定了它們的結(jié)構(gòu)。Pestalolide對白色念珠菌和新隱球菌具有較好的抗真菌活性。Uchoa等[41]通過改變培養(yǎng)條件,從巴西海岸篩選的一株黑曲霉中發(fā)現(xiàn)具有新的氮化骨架的天然呋喃衍生物(圖3-B),其對HCT-116細胞系具有毒活性。隨著研究的深入,真菌作為具有重大潛在價值的自然資源寶庫,在研究新型藥物和開發(fā)藥物先導化合物過程中將發(fā)揮重要作用。
圖2 青霉素(A)、頭孢菌素C(B)、紫杉醇(C)結(jié)構(gòu)
圖 3 抗HCV(A)、抗HCT-116(B)、Herquline A(C)、Pestrolide(D)結(jié)構(gòu)
分子生物學技術(shù)的發(fā)展,使人們對于生物體遺傳基因、代謝調(diào)控機制的了解愈加深刻,也越來越渴望通過基因水平定向?qū)ふ遗c實際需求相符的藥物,尤其近幾年計算機和數(shù)學等工具發(fā)展帶來的強大基因圖譜分析能力,更是為此提供強大的助力。隨著大量微生物遺傳圖譜公布,潛在的合成基因簇數(shù)據(jù)不斷積累,最終對于天然活性產(chǎn)物的挖掘?qū)玫骄畤娛桨l(fā)展,具有有效藥用價值的化合物也會越來越多,真菌由于自身特性也必將扮演重要的角色。盡管現(xiàn)如今對于微生物資源利用才剛剛起步,尚沒有完善的依托基因組挖掘技術(shù)開發(fā)藥物的流程,但可以預計,通過誘導激活沉默基因簇充分挖掘生物合成潛力,將成為未來新藥研發(fā)的重要手段,也會吸引更多國內(nèi)外科研工作者的興趣。