謝麗媛,姜逢霖,胡友財
(中國醫(yī)學科學院&北京協(xié)和醫(yī)學院藥物研究所,天然藥物活性物質與功能國家重點實驗室,北京 100050)
微生物來源的天然產物由于具有結構多樣、活性顯著等特點,一直以來是藥物先導化合物的重要來源。以活性為導向的微生物天然產物研究模式幫助研究人員獲得了大量具有藥物開發(fā)潛力的化合物,曾經引領了新藥尤其是抗生素研發(fā)的黃金時代。然而,自然界中存在的微生物分布極其廣泛,產生的天然產物更是數量巨大,僅采用傳統(tǒng)的研究模式已無法實現(xiàn)對活性天然產物的高效挖掘。已知化合物的重復發(fā)現(xiàn)、實驗室環(huán)境下微生物部分代謝產物的缺失等問題亟需開發(fā)新技術、新方法來解決[1-2]。
隨著基因組測序成本的大幅降低以及生物信息學技術的飛速發(fā)展,基因組導向的天然產物發(fā)現(xiàn)策略吸引了越來越多的關注。利用生物信息學手段對微生物的基因組數據庫進行挖掘,可以高效快速地鎖定具有研究價值的生物合成基因簇。基于基因簇中各個基因的功能,可以對天然產物的結構信息進行預測,從而助力研究人員實現(xiàn)目標天然產物的針對性分離。若基因簇在原始產生菌中不表達或表達量低,則可通過引入強啟動子、敲除轉錄抑制因子、過表達轉錄激活因子、異源表達或報告基因指導下的突變株篩選(reporter-guided mutant selection,RGMS)等策略對該基因簇進行激活,以獲得其表達產物[3-5]。
目前基因組挖掘的主要手段之一是基于核心酶進行挖掘。由于催化同一類型化合物骨架形成的核心酶具有序列保守性,可通過同源比對尋找編碼核心酶的基因,繼而對其上下游基因進行功能分析,獲得完整的生物合成基因簇[6-8]。有研究人員針對天然產物藥效團的生物合成基因進行基因挖掘,以此發(fā)現(xiàn)了許多結構新穎的活性天然產物[9]。
基因組挖掘的另一有效手段是基于自抗性基因進行挖掘,這是發(fā)現(xiàn)活性天然產物的另一高效策略。微生物產生的次級代謝產物通過抑制競爭者體內行使基本代謝功能的管家酶活性來殺死競爭者,或限制其生長。當這些代謝產物的產生菌體內也存在同源的管家酶時,為避免自身受到傷害,其天然產物生物合成基因簇內進化出自抗性基因,通過多種自抗性機制來發(fā)揮解毒作用。特別地,當簇內的自抗性基因編碼了管家酶的同源抗性變體時,該基因還可為天然產物的靶點發(fā)現(xiàn)提供線索,這也搭起了天然產物、生物合成基因簇和靶點之間的橋梁[10]。
本文旨在綜述微生物中常見的自抗性機制以及基于自抗性基因進行基因組挖掘的策略和應用,并對近年發(fā)展起來的相關生物信息學工具進行簡要介紹。
微生物為了生存,會合成有毒的次級代謝產物來殺死其競爭者或抑制其生長。為了不被自身代謝產物影響,同時利用它們創(chuàng)造競爭優(yōu)勢,產生菌必須進化出某種自抗性機制,以實現(xiàn)“殺敵不傷己”的效果。常見的自抗性機制包括外排泵、化合物封閉、前藥、化學修飾、靶點修飾、DNA 修復和管家酶抗性變體(即自抗酶)等[11](見圖1)。此外,某些微生物體內還存在多種自抗性機制的協(xié)同作用,從而實現(xiàn)更加有效的自我保護。
圖1 主要的自抗性機制Figure 1 Main mechanisms of self-resistance
外排泵(efflux pumps)可將微生物產生的次級代謝產物排出胞外,從而避免毒性化合物與胞內靶點蛋白相互作用。外排泵主要分為5 類:ATP 結合盒(ATP binding cassette,ABC)家族、主要易化超家族(major facilitator superfamily,MFS)、小多藥耐藥(small multidrug resistance,SMR)家族、多藥與毒物外排(multidrug and toxic microbial extrusion,MATE)家族和耐藥結節(jié)細胞分化(resistance-nodulation-cell division,RND)家族,其中最常見的是ABC 和MFS 家族。編碼外排泵的基因在許多天然產物的生物合成基因簇中均有報道,例如柔紅霉素(daunorubicin)生物合成基因簇中的drrA和drrB[12-13],土霉素(oxytetracycline)生物合成基因簇中的otrB[14]以及myxin 生物合成基因簇中的lexABC[15]等,它們與生物合成基因共同表達和調控,準確高效地發(fā)揮了自抗性作用。除此之外,部分編碼外排泵的基因并不與生物合成基因簇毗鄰。例如,基因efrT不在efrotomycin B1 的生物合成基因簇內,但其編碼的轉運蛋白在efrotomycin B1 的異源宿主體內起到了增強菌株自抗性、提高化合物產量的作用[16]。
通過編碼化合物結合蛋白,將化合物封閉在蛋白空腔內而不能與靶點蛋白結合的策略,稱為化合物封閉。例如,乳酸鏈球菌素(nisin)可與合成細胞壁的前體lipid Ⅱ結合,插入細菌細胞膜并形成孔洞,造成細菌死亡。為了避免自身的細胞膜受到影響,乳酸鏈球菌素的產生菌表達了脂蛋白NisI。NisI 不會對乳酸鏈球菌素進行修飾或降解,而僅僅是將其可逆地封閉起來,使其不能與細胞膜上的靶點結合[17]。在蒽醌駢合的烯二炔類化合物tiancimycin(TNM)的產生菌體內也存在類似的封閉策略,自抗性基因編碼的蛋白TnmS1,TnmS2 和TnmS3 形成β-桶狀結構,將tiancimycin 封閉在蛋白空腔中,保護產生菌不被烯二炔類化合物極強的毒性作用所影響[18]。同樣地,DNA 促旋酶抑制劑closthioamide 產生菌中編碼的聚硫酰胺結合蛋白CtaZ[19]、抗腫瘤化合物zorbamycin(ZBM)產生菌中編碼的ZBM 結合蛋白ZbmA[20]以及抗結核化合物capreomycin IIB 產生菌中存在的磷酸轉移酶Cph[21]也可通過化合物封閉的策略實現(xiàn)自我保護。
部分微生物在胞內僅產生低毒或無毒的藥物前體,稱為前藥。有些前藥在排出胞外后,就會在分泌蛋白或膜蛋白的催化下轉化為活性形式,如5-O-磷酸化安普霉素被分泌蛋白AprZ 去磷酸化形成活性終產物安普霉素(apramycin)[22],precolibactin 的N-酰基-D-天冬酰胺部分被周質中的內膜蛋白ClbP 水解形成colibactin[23]等;有些化合物則在產生菌體內一直保持前藥狀態(tài),直至被攝取后才會轉化為活性形式,如microcin C 只有被敏感細胞攝取后,其結構中的N-末端甲?;碗幕糠植艜蝗コ?,形成活性產物[24]。
為了降低胞內積累的天然產物對自身產生的毒性,微生物還會合成相應的酶對毒性產物進行化學修飾,如乙?;⒘姿峄?、糖基化、氧化還原等,使其轉化為低毒產物。例如,bleomycin(BLM)和tallysomycin(TLM)等博來霉素家族化合物需要與金屬離子結合形成螯合物,繼而在氧氣存在時被活化,才能發(fā)揮其誘導DNA降解和抗腫瘤的作用[25-27]。為了保證自身不受到傷害,該類化合物的產生菌合成了N-乙酰轉移酶,將乙?;D移到參與金屬螯合的其中1 個氨基上,抑制了金屬螯合物與氧氣的相互作用,避免了活化產物的形成[28-29]。同樣地,乙酰轉移酶AurG 可將真菌毒素aurovertin E 轉化為酰基化的低毒產物aurovertin B[30],磷酸轉移酶Cph 和Mur28 可分別使capreomycin IIA 和muraymycin 發(fā)生磷酸化失活[21,31]。
活性天然產物可以特異性地識別并結合靶點,進而干擾機體的正常生命活動。當靶點的特異性結合位點被修飾后,藥物與靶點結合的親和力會顯著降低,從而起到自我保護的效果。例如,dityromycin 可通過結合核糖體蛋白S12 來抑制核糖體移位,從而影響蛋白質的合成。在dityromycin 的產生菌Streptomycessp.中,核糖體蛋白S12 上高度保守的抗生素結合位點發(fā)生2 個氨基酸的替換,降低了其與dityromycin 的親和力,避免了dityromycin對自身的傷害[32]。同樣,holomycin 生物合成基因簇中的hom12編碼了1 個RNA 甲基轉移酶,使得靶點位置的RNA 被甲基化,避免了holomycin 對產生菌體內RNA 合成的抑制作用[33]。糖肽類抗生素的自抗性機制也屬于典型的靶點修飾。糖肽類抗生素通過與肽聚糖前體脂質Ⅱ的D-丙氨酰-D-丙氨酸(D-alanyl-D-alanine,D-Ala-D-Ala)末端結合抑制細胞壁的合成。為了避免對自身生命活動的影響,糖肽類抗生素的產生菌對靶點進行了不同方式的修飾,如將肽聚糖前體脂質Ⅱ的D-Ala-D-Ala 末端替換為D-丙氨酰-D-乳酸(D-alanyl-D-lactate,D-Ala-D-Lac)[34-38]或去除末端的D-Ala 殘基[39-41]等。
抗腫瘤活性化合物能夠造成DNA 損傷,影響功能基因的正常轉錄和翻譯,進而導致細胞死亡。為了保證生命活動不受影響,微生物進化出了DNA修復機制。其中,堿基切除修復(base excision repair,BER)機制主要用于消除小的、非螺旋扭曲的堿基損傷,如烷基化、氧化和脫氨基等。例如,yatakemycin(YTM)誘導DNA 發(fā)生烷基化,其生物合成基因簇中編碼的YtkR2 可啟動BER 機制對DNA 進行修復[42]。核苷酸切除修復(nucleotide excision repair,NER)機制則用于去除體積大的、螺旋不穩(wěn)定的損傷,例如daunorubicin 生物合成基因簇中編碼的DrrC 可通過NER 機制將daunorubicin從非共價嵌合部位去除,恢復DNA的正常轉錄[43-44]。
如前所述,若微生物次級代謝產物靶向的管家酶在產生菌體內保守存在,則該代謝產物必然對產生菌也有毒性作用。因此微生物會在某些代謝產物的基因簇內編碼1 個管家酶的抗性變體,即自抗酶。自抗酶與管家酶的氨基酸序列高度相似,具有相同的催化活性;同時自抗酶中存在部分氨基酸突變使得其對代謝產物的敏感性降低,在管家酶被抑制時可以代償管家酶行使相應的功能[10]。例如,降脂藥物洛伐他?。╨ovastatin,1,見圖2)是通過抑制3-羥基-3-甲基戊二酸單酰輔酶A 還原酶(3-hydroxy-3-methyl glutaryl coenzyme A reductase,HMGR)活性發(fā)揮降脂作用,其生物合成基因簇中的lvrA可編碼HMGR 的抗性變體,從而發(fā)揮自抗作用[45-46];霉酚酸(mycophenolic acid,2,見圖2)可通過抑制肌苷-5'-單磷酸脫氫酶(inosine-5'-monophosphate dehydrogenase,IMPDH)的活性來發(fā)揮免疫抑制作用,其生物合成基因簇中編碼的IMPDH 抗性變體實現(xiàn)了產生菌對霉酚酸的自抗作用[47];煙曲霉素(fumagillin,3,見圖2)是一種有效的抗血管生成藥物,可通過抑制甲硫氨酸氨肽酶-2(methionyl aminopeptidase 2,MetAP-2)來發(fā)揮其藥理作用,為了實現(xiàn)自我保護,煙曲霉素的基因簇中編碼了MetAP-2 的抗性變體,可在管家酶活性被抑制時行使代償功能[48]。此外,cladosporin(4,見圖2)生物合成基因簇中編碼的賴氨酰-tRNA 合成酶同源蛋白Cla4[49]、heptelidic acid(5,見圖2)簇中編碼的甘油醛-3-磷酸脫氫酶同工酶HepG[50-51]以及 agrocin 84(6,見圖2)簇中編碼的亮氨酸t(yī)RNA 合成酶抗性變體AgnB2[52-53]等也采用了這種策略來抵抗自身代謝產物對產生菌的影響。
值得關注的是,許多微生物體內對代謝產物的自抗性并不是通過單一機制實現(xiàn)的,而是利用了多種自抗性機制的協(xié)同作用[54]。例如,在萘啶霉素(naphthyridinomycin)[55-56]和A26771B[57]的生物合成過程中,產生菌均同時采用了前藥機制和化合物修飾機制,保護自身不被代謝產物的毒性作用所影響。在萘啶霉素的生物合成過程中,低毒前藥分泌至胞外后,才會被膜蛋白NapG 和分泌蛋白NapU 活化,轉化為活性產物萘啶霉素[55],NapW則在胞內通過化合物修飾將毒性中間體及進入胞內的萘啶霉素轉化為低毒形式[56]。A26771B 生物合成基因簇中編碼的分泌蛋白BerkD 可將排出胞外的低毒前藥berkeleylactone E 轉化為活性化合物A26771B。當A26771B 進入胞內時,短鏈還原酶/脫氫酶BerkC 還可將A26771B 的C-4 位羰基還原為羥基來降低其毒性[57]。同樣地,在最小霉素(minimycin)的生物合成過程中也存在多種自抗性機制的協(xié)同作用。最小霉素生物合成基因簇中編碼的MinCN 可將毒性中間體最小霉素單磷酸的磷酸基團脫去,從而緩解其毒性作用;同時,尿嘧啶磷酸核糖轉移酶MinD 可催化形成大量尿苷單磷酸,與胞內殘留的最小霉素單磷酸競爭靶點,從而降低最小霉素單磷酸與靶點的結合能力,最終實現(xiàn)對宿主的自我保護[58]。
自抗性基因將天然產物的生物合成基因簇與其生物活性聯(lián)系起來,為基因組挖掘提供了新策略[10,59]。一方面,自抗性基因通常與天然產物生物合成基因簇共定位,可作為基因簇的“定位標簽”,用于指導天然產物生物合成基因簇的發(fā)現(xiàn);另一方面,自抗性基因還可作為“活性標簽”,指示基因簇產物的生物活性,或用于對基因組數據庫進行廣泛挖掘,探索特定活性天然產物的生物合成基因簇。
在自抗性基因指導基因簇發(fā)現(xiàn)的早期研究階段,研究人員基于自抗功能來尋找目標基因簇,即利用代謝產物對產生菌的基因組文庫進行抗性篩選,能夠賦予基因文庫受體菌抗性的片段必然包含自抗性基因,而基因組中與自抗性基因毗鄰的生物合成基因簇最有可能參與該代謝產物的生物合成。借助這一策略,殺稻瘟菌素(blasticidin S,BS)(7,見圖3)和andrimid(8,見圖3)等化合物的生物合成基因簇相繼被鑒定出來。BS 是來源于Streptomyces griseochromogenes的肽基核苷類抗生素,廣泛應用于植物病原真菌Pyricularia oryzae的防治[60]。Cone 等[61]利用BS 對S. Griseochromogenes的基因組文庫進行抗性篩選,以獲得的抗性DNA 片段作為探針成功鑒定到BS 的完整生物合成基因簇bls。該基因簇包含19 個開放閱讀框,抗性DNA 探針中包含的blsJ編碼了1 個ABC 家族的轉運蛋白,可將毒性產物轉運出去以避免對自身的傷害[62]。除此之外,簇中blsK編碼的氨酰tRNA 轉移酶通過催化低毒藥物前體亮氨酰脫甲基殺稻瘟菌素(leucyldemethylblasticidin S,LDBS)和亮氨酰殺稻瘟菌素(leucylblasticidin S,LBS)的形成也參與了對BS 的自抗[63-64]。采用類似的策略對成團泛菌(Pantoea agglomerans)的基因組文庫進行篩選,Jin 等[65]獲得了乙酰輔酶A 羧化酶(acetyl CoA carboxylase,ACC)抑制劑andrimid 的完整生物合成基因簇adm。其中admQ編碼的MFS 家族轉運蛋白負責將胞內積累的andrimid 轉運出去,admT編碼的自抗酶與管家酶乙酰輔酶A 羧化酶β 亞基AccD 的氨基酸序列高度相似,但203 位的亮氨酸突變?yōu)榧琢虬彼崾沟肁dmT 對andrimid 的抗性顯著增加[65-67]。
圖3 自抗酶基因指導下鑒定生物合成基因簇的天然產物示例Figure 3 Examples of natural products identifying biosynthetic gene clusters guided by self-resistant enzyme genes
隨著對自抗酶的認識不斷深入,研究人員開始將編碼自抗酶的基因作為基因簇篩選的條件之一。當化合物的作用靶點(即管家酶)已知時,可根據序列相似性尋找基因組中的抗性拷貝,繼而獲得完整的生物合成基因簇。霉酚酸(2,見圖2)是由青霉屬真菌產生的免疫抑制劑,通過抑制IMPDH 的活性來發(fā)揮其藥理作用[68]。利用產生菌Penicillium brevicompactum基因組中克隆得到的IMPDH 序列片段作為探針對基因組文庫進行篩選,Regueira 等[69]獲得了2 組編碼IMPDH 的DNA 片段。由于原始IMPDH 基因周圍總是存在1 個編碼rasGTPase 激活蛋白的基因,作者利用排除法成功鑒定到霉酚酸的生物合成基因簇mpa。異源表達實驗結果表明,簇內mpaF編碼的IMPDH 對霉酚酸具有顯著的自抗作用[47]。Coumermycin A1(9,見圖3)是由Streptomyces rishiriensis產生的香豆素類化合物,具有抑制DNA 促旋酶活性的作用。Wang 等[70]同時以核心基因(dTDP-葡萄糖4,6-脫水酶基因)和抗性促旋酶基因gyrBr作為探針對產生菌的基因組文庫進行篩選,成功定位到coumermycin A1 的生物合成基因簇cum。
由于基因組測序成本大幅降低,僅通過生物信息學手段對基因組數據進行分析,而不必借助繁雜的實驗操作就可對基因簇進行初步定位。煙曲霉素(3,見圖2)是由萜類化合物fumagillol 和聚酮decatetraenedioic acid 酯化形成的MetAP-2 抑制劑[71]。Lin 等[48]對煙曲霉素產生菌Aspergillusfumigatus的基因組進行篩選,發(fā)現(xiàn)fma基因簇中同時存在高度還原型聚酮合酶(highly-reducing polyketide synthase,HR-PKS)基因af370和MetAP-2基因af410,最有可能參與煙曲霉素的生物合成。基因敲除和體外生化實驗結果表明,fma基因簇中聚酮合酶(polyketide synthase,PKS)和酰基轉移酶負責聚酮部分的生物合成,而簇中編碼的新型萜環(huán)化酶fma-TC 能夠催化法尼基焦磷酸(farnesyl pyrophosphate,F(xiàn)PP)轉化為煙曲霉素的中間體β-順式-佛手柑油烯。Kato 等[72]利用潮霉素B 對Fusariumsp. RK97-94 進行誘導,在代謝產物中分離得到3-羥基-3-甲基戊二酸單酰輔酶A 合成酶(3-hydroxy-3-methyl glutaryl coenzyme A synthase,HMGS)抑制劑1233A(10,見圖3)[73]。結合轉錄組數據和基因組數據,作者發(fā)現(xiàn)在潮霉素誘導下轉錄水平升高的7 個基因簇中,3 號基因簇同時存在負責骨架形成的PKS 基因和HMGS 基因,于是將該基因簇確定為候選基因簇?;蚯贸龑嶒灲Y果表明,簇中各基因均與HMGS 抑制劑1233A 的生物合成相關,這也說明自抗酶在基因簇鑒定過程中可作為重要的篩選條件[72]。
當天然產物產生菌的基因組尚未測序或基因組數據難以獲得時,還可利用抗性基因對公開數據庫進行挖掘,在新的產生菌中獲得目標基因簇。例如,restricticin(11,見圖3)和lanomycin(12,見圖3)能夠通過與血紅素鐵配位發(fā)揮抑制甾醇14α-去甲基化酶(sterol 14α-demethylase,CYP51)活性的作用,但由于已知產生菌Penicillium restrictum和Pycnidophora dispersea的基因組尚未測序,這2 個化合物的生物合成途徑遲遲未能得到解析。Liu 等[74]采用自抗酶導向的基因組挖掘策略,利用其課題組開發(fā)的算法對公共數據庫進行挖掘,發(fā)現(xiàn)了5 個同時編碼CYP51 和相關生物合成酶的基因簇。其中rstn簇參與了restricticin 的生物合成,簇中各基因的功能也通過異源表達和體外生化反應得到了闡明。另外,在Curvularia lunata和Pyrenophora dematioidea(TTI-1096)中均保守存在的基因簇則參與了lanomycin 的生物合成。研究人員利用單菌株多次級代謝產物(one strain many compounds,OSMAC)策略對P. dematioidea中該基因簇進行激活,發(fā)現(xiàn)利用Wheat1 培養(yǎng)基進行發(fā)酵時,在發(fā)酵產物中檢測到了lanomycin 的產生。
值得注意的是,有些基因簇中編碼的管家酶同源蛋白未必行使自抗功能,而是負責化合物的一步生物合成。例如,SB-203207(13,見圖4A)和SB-203208(14,見圖4A)是Streptomycessp.NCIMB 40513 產生的異亮氨酸t(yī)RNA 合成酶抑制劑。利用自抗性基因指導的基因組挖掘策略,Hu等[75]鑒定了化合物13 和14 的生物合成基因簇sbz(見圖4A)。但對簇中各基因功能進行研究時,作者發(fā)現(xiàn)sbz簇中編碼的異亮氨酸合成酶SbzA 催化tRNAIle氨?;男蔬h不如基因組中的管家酶Ssp_IleRS,且SbzA 可以在Ile-tRNAIle存在時將異亮氨酸轉移到中間體altemicidin 上,即參與了化合物的生物合成(見圖4B)。提示當生物合成酶與管家酶的催化功能存在相似性時,可能會對自抗性基因導向的基因組挖掘造成信息誤導,需要仔細甄別。
圖4 未行使自抗功能的自抗酶基因舉例Figure 4 Examples of self-resistant enzyme genes without self-protection function
由于自抗性基因具有“活性標簽”的特點,研究人員逐漸意識到,天然產物的生物合成基因簇除了能夠闡明生物合成途徑,還為天然產物的生物活性研究提供了線索。例如,rumbrins 類化合物是含氯多烯吡咯類化合物,具有抗癌、抗脂質過氧化和細胞保護作用等多種藥理活性[76-77]。筆者課題組[78]在研究rumbrin(15,見圖5)的生物合成過程中,發(fā)現(xiàn)了1 個潛在的自抗酶RumB。簇中基因rumB在rumbrin 的生物合成中保持轉錄,但并不參與其生物合成。生物信息分析表明,RumB 與人源硫酯酶Ⅱ(human thioesterase II,hTE)具有較高的同源性,hTE 是人類免疫缺陷病毒(human immunodeficiency virus,HIV)輔助蛋白Nef 在宿主中的分子伴侶,在HIV 感染的早期階段發(fā)揮了重要作用。因此筆者課題組推測rumbrins 類化合物可能通過靶向hTE 來發(fā)揮抗HIV 活性。體外活性評價實驗證明,大多數rumbrins 對HIV 復制的早期階段具有明顯的抑制作用(納摩爾級),并且化合物12E-rumbrin 的抑制率與陽性藥相當,這與生物信息分析的結果一致。同時,筆者課題組在對同源基因簇進行分析時,發(fā)現(xiàn)參與malbranpyrroles 生物合成的mas簇中缺少rumB的同源基因。相應地,malbranpyrroles 展示出極弱的抗HIV 活性。以上結果表明自抗酶對化合物靶點發(fā)現(xiàn)具有啟示作用,為基于自抗性基因發(fā)現(xiàn)先導化合物及其作用靶點提供了新的思路。
圖5 自抗性基因指導下闡明天然產物靶點的示例Figure 5 Natural products targets elucidated under the guidance of self-resistant enzyme genes
在淺灰霉素類化合物(griselimycins)作用靶點的發(fā)現(xiàn)過程中,自抗酶基因也發(fā)揮了不可或缺的作用。淺灰霉素(griselimycin,GM,16,見圖5)由Streptomycessp. DSM-40835 產生,具有抗多藥耐藥結核分枝桿菌活性。Kling 等[79]鑒定了GM 的生物合成基因簇,并在簇中發(fā)現(xiàn)了dnaN的同源基因griR,dnaN負責編碼管家酶DNA 聚合酶的滑動鉗部分,在DNA 復制過程中發(fā)揮重要作用。由于griR基因的引入可使原本對GM 敏感的異源宿主產生抗性,且表面等離子共振(surface plasmon resonance,SPR)結果顯示GriR 與GM 的親和力遠低于DnaN,因此作者推測GriR 為基因簇中編碼的自抗酶,而DnaN 為淺灰霉素類化合物的靶點。Obafluorin(17, 見圖5) 是由Pseudomonas fluorescensATCC 39502 產生的β-內酯類化合物,對革蘭陽性菌和陰性菌均有抑制作用。Scott 等[80]發(fā)現(xiàn)在obafluorin 的生物合成基因簇oba中存在1 個編碼蘇氨酰-tRNA 合成酶的基因obaO,當obaO被敲除時,敲除菌株對obafluorin 的敏感性顯著增加,且導入obaO的大腸埃希菌顯示出了對obafluorin的抗性。因此,作者推測obafluorin 的靶點為蘇氨酰-tRNA 合成酶,而ObaO 為基因簇中的自抗酶。體外生化實驗驗證了這一推測。當存在1 μmol · L-1的obafluorin 時,管家酶蘇氨酰-tRNA 合成酶可被obafluorin 完全抑制,而在最大濃度的obafluorin 中自抗酶ObaO 依然保持部分活性。同樣地,Xie 等[81]在研究harzianic acid(18,見圖5)的靶點時也采用了自抗性基因導向的策略。由于Trichoderma afroharzianumt-22(Tht22)體內參與harzianic acid生物合成的基因簇中編碼了1 個乙酰羥酸合成酶(acetohydroxyacid synthase,AHAS,在該真菌中命名為ThAHAS),作者推測harzianic acid 的作用靶點為AHAS。結合生物信息分析、體外生化反應和對ThAHAS 的晶體結構研究,作者發(fā)現(xiàn)harzianic acid 不僅可抑制原始的AHAS,對P188 發(fā)生突變的抗性AHAS 也產生了明顯的抑制作用。
除了為天然產物的生物活性研究提供線索之外,自抗性基因還可用于指導海量基因組數據中特定活性化合物生物合成基因簇的發(fā)現(xiàn),從而獲得新的活性化合物。Tang 等[82]基于自抗酶基因的特點開發(fā)出一套完整的基因組挖掘流程,并利用這一流程對鹽孢菌屬細菌基因組進行了廣泛的挖掘。利用同源基因聚類、直系同源組功能鑒定等方法,作者在參與脂質轉運和代謝的直系同源組中發(fā)現(xiàn)了管家酶FabB/F 的同源蛋白Salin8269。Salin8269 位于tlm基因簇內,當對tlm簇進行異源表達時,作者在代謝產物中分離到具有Ⅱ型脂肪酸合成酶(fatty acid synthase type II,F(xiàn)ASII)抑制活性的thiotetronic acids 類化合物(19 ~ 22,見圖6),其中包括已知的thiolactomycin(TLM)。同時,作者利用同源比對方法,在Streptomyces afghaniensis中找到了類似的基因簇ttm,并在其異源表達產物中分離到一系列新的TLM 同系物(23 ~ 26,見圖6)。Thiotetronic acids 類化合物的發(fā)現(xiàn)證實了基于自抗酶進行基因組挖掘這一策略的可行性。
圖6 以自抗性基因為導向挖掘的天然產物示例Figure 6 Discovery of natural products guided by self-resistant gene
自抗性基因導向的基因組挖掘在新型除草劑的開發(fā)中也發(fā)揮了重要作用。支鏈氨基酸(branchedchain amino acid,BCAA)的生物合成對植物的生長至關重要,由于該途徑在動物中并不存在,因此是除草劑開發(fā)的理想靶點。BCAA 的生物合成過程中有3 個酶參與,包括乙酰乳酸合酶(acetolactate synthase,ALS)、乙酰羥基酸異構還原酶(ketolacid reductoisomerase,KARI)和二羥基酸脫水酶(dihydroxyacid dehydratase,DHAD)。Zhang 等[83]以ALS 為探針對459 個真菌測序基因組進行篩選,發(fā)現(xiàn)了4 個含有ALS 編碼基因的生物合成基因簇,其中Aspergillus candidus基因組中的cfo簇參與了氯黃酮(27,見圖6)的生物合成。氯黃酮可有效抑制擬南芥種子萌發(fā)和病原菌生長,且基因敲除和異源表達實驗證實,簇中ALS 編碼基因cfoL參與了A. candidus對氯黃酮的自抗作用。Yan 等[84]則在已測序的真菌基因組中對與生物合成核心基因共定位的DHAD 基因進行挖掘,發(fā)現(xiàn)在多個真菌基因組中保守存在的ast簇編碼了1 個DHAD 同源蛋白AstD。作者利用釀酒酵母對ast簇進行異源表達,并分離得到基因簇產物aspterric acid(28,見圖6)。Aspterric acid 表現(xiàn)出對多種植物的生長和根系發(fā)育的抑制作用[84-85],這使其有望發(fā)展成為新一代廣譜除草劑。體外生化反應和異源表達實驗結果表明,aspterric acid 可以競爭性地抑制管家酶DHAD 的活性,而ast簇中編碼的同源蛋白AstD 在aspterric acid 的濃度達到溶解度極限(8 mmol · L-1)的情況下,依然可以行使正常的催化功能。同時,當擬南芥中導入密碼子優(yōu)化的astD基因時,轉基因植株表現(xiàn)出對aspterric acid 的抗性。提示astD基因可用于抗aspterric acid 作物的培育,這也使得aspterric acid的除草劑開發(fā)更具前景。
Elfamycins 是一系列具有鏈延長因子Tu(elongation factor Tu,EF-Tu)抑制活性的抗生素[86],由kirromycin,enacyloxin IIa,pulvomycin 和GE2270A 這4 類結構不同的化合物組成。Kirromycin通過阻斷核糖體上EF-Tu·GDP(guanosine diphosphate,二磷酸鳥苷)的構象變化而發(fā)揮抑制作用[87],鏈霉菌中針對kirromycin 的抗性突變主要發(fā)生在EF-Tu 的375 位丙氨酸(A375T)上。Yarlagadda 等[88]基于抗性EF-Tu(A375T,EF-TuKirR)基因對鏈霉菌基因組進行挖掘,發(fā)現(xiàn)3個含有潛在elfamycins 生物合成基因簇的菌株,其中Streptomyce cattleya已知可以產生elfamycin L-681217。此外,作者在篩選到的S. sulphureusATCC 27468 代謝產物中分離得到phenelfamycin A(29,見圖6)和phenelfamycin B(30,見圖6),其中phenelfamycin B 可通過干擾EF-Tu 抑制蛋白質合成,具有抗耐藥淋病奈瑟菌的活性。
ClpP 蛋白酶是ATP 依賴的蛋白水解酶,在原核及真核生物的線粒體中廣泛存在。Culp 等[89]以ClpP 為探針進行基因組挖掘,篩選到10 條含有clpP基因的生物合成基因簇,并對其中同時包含雙模塊非核糖體肽合成酶(nonribosomal peptide synthase,NRPS)基因和Ⅰ型PKS 基因的cac基因簇進行了深入研究。由于cac基因簇異源表達產物可對ClpP 進行共價修飾(ClpP 相對分子質量增加約328 000),作者認為cac簇必然參與了共價ClpP 抑制劑的生物合成,并基于以上結果分離得到cac簇的真實產物clipibicyclene(31,見圖6)。Clipibicyclene 可顯著抑制管家酶ClpP 的活性,且cac簇中編碼的ClpP 同源蛋白(Cac16 和Cac17)參與了產生菌對clipibicyclene 的自抗作用。
有些自抗性基因雖然并非編碼管家酶抗性變體的基因,但由于在特定靶點抑制劑的生物合成基因簇中廣泛存在,也可用于指導基因組挖掘。例如,拓撲異構酶是抗腫瘤藥物和抗生素作用的重要靶點,而五肽重復蛋白(pentapeptide repeat protein,PRP)提供了微生物對拓撲異構酶抑制劑的抗性[90]。Panter 等[91]以PRP 為探針,對黏細菌基因組進行自抗性基因導向的基因組挖掘,在PyxidicoccusfallaxAn d48 中發(fā)現(xiàn)了新型拓撲異構酶抑制劑pyxidicycline A(32, 見圖6) 和pyxidicycline B(33,見圖6)。Li 等[92]則利用普遍存在的四環(huán)素類化合物自抗性基因(tetR/marR和鄰近轉運蛋白基因如tetA)以及核心酶基因(PKS 基因和鏈延長因子基因)對國家生物技術信息中心(National Center of Biotechnology Information,NCBI)中已注釋的20 000 余個基因組進行篩選,通過對候選基因簇中鏈延長因子的進化樹分析,發(fā)現(xiàn)了30 個可能參與四環(huán)素類化合物生物合成的基因簇。經實驗驗證,其中的hai基因簇為高度糖基化的新穎四環(huán)素類化合物hainancycline(34,見圖6)的生物合成基因簇。
隨著基因組數據的爆炸式增長,對基因組數據進行手動挖掘已難以滿足科研人員的需求。因此許多生物信息學工具涌現(xiàn)出來,這為研究者基于自抗性基因進行基因組挖掘提供了有力幫助。
AntiSMASH(antibiotics and secondary metabolites analysis shell,https://antismash.secondarymetabolites.org)是廣泛應用于細菌和真菌生物合成基因簇分析的生物信息學平臺。2019 年推出的antiSMASH 5.0使用耐藥蛋白數據庫Resfams 的隱馬爾可夫模型(profile Hidden Markov Models,pHMMs)對基因簇中潛在的自抗性基因進行注釋,為自抗性基因導向的基因組挖掘提供了條件[93]。ClusterTools(https://github.com/emzodls/clusterArch)是基于BLAST(basic local alignment search tool)和pHMMs 構建的基因組挖掘軟件。用戶以核心酶或存在特定結構域組合的蛋白為篩選條件,尋找感興趣的基因簇。除了對參與生物合成的基因進行篩選之外,clusterTools 還可將參與基因調控和自抗的基因作為篩選條件,因而可用于自抗性基因導向的基因組挖掘[94]。
Alanjary 等[95]開發(fā)了搜索引擎Antibiotic Resistant Target Seeker(ARTS,https://arts.ziemertlab.com)。該網站基于3 個標準對自抗性基因進行篩選:是否存在管家基因的重復拷貝;是否定位于生物合成基因簇內;是否存在水平基因轉移現(xiàn)象。篩選結果最終匯總到交互式輸出表中,用戶可根據需要進行篩選和排序,非常便捷。最初版本的ARTS 只能應用于放線菌中,2020 年更新的ARTS 2.0[96]則可對所有細菌基因組和宏基因組數據進行分析。此外,ARTS 2.0還可對不同基因組中的相似基因簇及簇中的自抗性基因進行比較。由于ARTS 只能充當網絡服務器,每次只能執(zhí)行單項分析任務,且需要一定的時間進行數據處理,開發(fā)者們又推出了ARTS-DB 數據庫(https://arts-db.ziemertlab.com/)[97]。ARTS-DB 提供了70 000 余個基因組和宏基因組預先計算的ARTS 結果,用戶可根據ARTS 篩選的基本標準(基因拷貝、臨近基因簇和水平基因轉移)對數據庫進行檢索。不僅如此,ARTS-DB 數據庫中還提供了其他含有相關信息數據庫的鏈接,便于用戶對篩選結果進行進一步分析。
Stahlecker 等[98]開發(fā)了基于系統(tǒng)發(fā)育對目標基因周圍片段(neighborhoods of gene of interest,NGIs)進行可視化分析的工具——SYN-View(https://bitbucket.org/jstahlecker/syn-view/)。由于在親緣關系接近的菌株中管家基因的NGIs 往往保守存在,而自抗性基因的NGIs 之間存在明顯差異,因此SYN-View 的可視化結果可作為ARTS 等分析工具的補充,對ARTS 篩選得到的自抗性基因進行進一步篩選和確認。
Vandova 等[99]開發(fā)了與ARTS 類似的算法(https://github.com/GerganaVandova/TargetMining)。該算法除了采用基因的重復拷貝以及自抗性基因與生物合成基因簇之間的距離作為篩選標準之外,還增加了對自抗酶與核心酶之間共進化關系的分析,對核心基因與自抗性基因之間距離的要求也更嚴格。作者利用陽性對照組驗證了算法的可行性,并對NCBI 數據庫中的PKS 基因簇進行了篩選和排序,篩選結果可為新型抗生素的研發(fā)提供參考。
Kj?rb?lling 等[100]開發(fā)的真菌自抗性基因導向的基因組挖掘(fungal resistance gene-directed genome mining,F(xiàn)RIGG)管線也是基于自抗酶基因的特點進行基因挖掘的:自抗酶基因位于基因簇內,并且是基因簇內管家基因的同源拷貝。該管線包含5 步篩選過程,對存在自抗性基因的基因簇進行篩選并過濾掉可能存在的假陽性結果。利用主成分分析(principal-component analysis,PCA)、進化樹分析、功能注釋和BLASTp(對蛋白質的氨基酸序列進行同源性比對,尋找同源蛋白或對蛋白質進行功能預測)對篩選得到的候選基因簇進行進一步分析,可使篩選更高效。利用這一篩選策略,作者在51 株曲霉菌和青霉菌的基因組中鑒定到72 個潛在的自抗性基因,其中包含已經得到功能表征的自抗性基因inpE(參與產生菌對fellutamide B 的自抗性機制),證實了該工具的有效性。值得注意的是,該管線更適用于對親緣關系較為接近的真菌基因組進行分析,若數據庫中包含親緣關系較遠的真菌,則需要對篩選參數進行適當調整。
自抗性是保證產生天然產物的微生物“殺敵不傷己”的重要機制,也為后基因組時代的基因組挖掘提供了新的策略和思路。本文歸納了微生物常見的自抗性機制,對自抗性基因導向的基因組挖掘策略及其應用進行了分類介紹,同時還對已開發(fā)的基于自抗性基因進行基因組挖掘的生物信息學工具進行了匯總。盡管基于自抗性基因進行基因組挖掘的策略卓有成效,但仍存在一些亟待解決的問題。例如,自抗性基因可能存在于基因組中的其他位置而非基因簇內[101];部分自抗性機制與天然產物的生物合成途徑融合,自抗性基因編碼的酶既具有抗性,同時又作為天然產物的生物合成途徑酶而存在[102];某些生物合成基因簇中的管家基因拷貝并未編碼抗性酶,而是參與了化合物生物合成[75]等。隨著對天然產物生物合成以及自抗性機制的深入研究,研究人員有望利用人工智能、機器學習等手段設計出更加合理高效的生物信息學工具和數據庫,更精準地預測生物合成基因簇、基因簇產物及天然產物的靶點,從而實現(xiàn)對微生物中天然產物資源更好的開發(fā)和利用。