黃莎莎, 蘇正定
工業(yè)發(fā)酵教育部重點(diǎn)實(shí)驗(yàn)室和湖北省工業(yè)微生物重點(diǎn)實(shí)驗(yàn)室湖北工業(yè)大學(xué)生物工程與食品學(xué)院,武漢 430068
甾體(steroids)是一類結(jié)構(gòu)非常特殊的天然產(chǎn)物,其分子母體結(jié)構(gòu)中都含有環(huán)戊烷并多氫菲(cyclopentano-perhydrophenanthrene)碳骨架,此骨架又稱甾核(steroid nucleus)。甾體化合物又稱為類固醇,屬于脂類的一種,自然界中有上千種甾類物質(zhì),存在于動(dòng)、植物及某些微生物細(xì)胞中。甾體類藥物在臨床上具有廣泛的應(yīng)用,為僅次于抗生素的第二大類藥物。目前工業(yè)上主要利用分枝桿菌轉(zhuǎn)化甾醇制備甾體藥物起始和中間體原料。目前,人們已對(duì)分枝桿菌甾體降解途徑中的許多關(guān)鍵酶進(jìn)行了研究,但對(duì)降解途徑尚未完全了解。近年來,工業(yè)微生物分枝桿菌甾體降解途徑基因組分析的重要性引起廣泛的注意。為了更深入地了解甾體降解途徑,本文介紹了分枝桿菌基因組學(xué)、代謝組學(xué)的研究進(jìn)展。
甾類化合物是一類特殊的多元環(huán)萜化合物,結(jié)構(gòu)上由(A、B、C)三個(gè)完整封閉的六元環(huán)和一個(gè)五元環(huán)(D)的環(huán)戊烷多氫菲及一些官能取代基組成。甾類化合物包括甾醇、膽汁酸、維生素D、神經(jīng)甾體以及類固醇激素等,具有重要的生理醫(yī)藥功能[1-2],如腎上腺皮質(zhì)激素具有抗炎癥等功效。甾類化合物市場(chǎng)需求大,利用微生物法制備甾類化合物的工藝具有環(huán)境污染小、專一性較強(qiáng)、反應(yīng)步驟少、產(chǎn)品回收率高等優(yōu)點(diǎn)[3,35]。眾多微生物菌屬中分枝桿菌能夠降解甾醇轉(zhuǎn)化關(guān)鍵甾類藥物中間體4-雄烯二酮(4-Androstene-3,17-dione,4-AD)、1,4-雄烯二酮(Androsta-1,4-diene-3,17-dione,ADD)、雄甾醇-4-烯-3,17-二酮(9-Hydroxy-4-androstene-3,17-dione,9-OH-AD)。
分枝桿菌(Mycobacterium sp.)屬于放線菌目,是一類細(xì)長(zhǎng)略帶彎曲的桿菌,有分枝桿菌生長(zhǎng)趨勢(shì),可分為三組:結(jié)核桿菌、非結(jié)核桿菌與麻風(fēng)桿菌;結(jié)核桿菌和麻風(fēng)桿菌以危害嚴(yán)重的傳染性病原菌聞名,多年來是醫(yī)學(xué)和分子生物學(xué)等領(lǐng)域的研究熱點(diǎn)。截至2021年6月為止,Genome Online database數(shù)據(jù)庫中共記錄了244株分枝桿菌的全基因組測(cè)序信息,其中完成測(cè)序的為216株,正在測(cè)序的有25株,計(jì)劃測(cè)序的有1株,針對(duì)性測(cè)序的有1例(https://www.genomesonline.com)。
非致病型分枝桿菌是常用的工業(yè)菌株,具有眾多分枝桿菌的重要生理特征,例如該菌細(xì)胞壁含有大量的脂質(zhì)影響甾醇轉(zhuǎn)化活性,主要成分為分支菌酸等[4-5],其中以膽固醇營養(yǎng)物質(zhì)等甾醇為唯一碳源并開環(huán)降解為自身提供能量。2008年P(guān)ANDEY等研究中[6]證實(shí)結(jié)核桿菌降解膽固醇并從中獲取能源和能源化合物,結(jié)核分枝桿菌維持較慢的感染能力與它獲得膽固醇的能力密切相關(guān),也是造成肺結(jié)核長(zhǎng)時(shí)間不愈的重要原因[7]。但是,分枝桿菌降解膽固醇的能力也有其利用價(jià)值的一面,即分枝桿菌可轉(zhuǎn)化膽固醇等天然植物甾醇生成系列代謝中間體和藥物前體,因而具有重要應(yīng)用價(jià)值。1944年TURFITT等[8]等發(fā)現(xiàn)分枝桿菌可完全降解代謝膽固醇側(cè)鏈和骨架;1972年MARSHECK等[9]利用不需要添加抑制劑的誘變選育方法得到了分枝桿菌NRRL B-3805,能有效轉(zhuǎn)化4AD為睪酮,轉(zhuǎn)化ADD成為AD,從而奠定了分枝桿菌降解甾醇工業(yè)化應(yīng)用的基礎(chǔ)。
多種可降解甾類的微生物菌屬中,其中以紅球菌屬與分枝桿菌屬代謝能力受到最為廣泛的關(guān)注,利用誘變選育可作為積累甾藥中間體AD等的重要微生物工廠[1,10-14]。紅球菌曾經(jīng)很長(zhǎng)一段時(shí)間被認(rèn)為是紫紅分枝桿菌,直到1978年才正式承認(rèn)紅球菌這個(gè)屬名,是介于分枝桿菌與諾卡氏菌Nocardia之間的一類微生物,具有好氧、革蘭氏陽性、多形態(tài)菌、菌落粗糙與分枝桿菌類似的特點(diǎn)[15]。紅球菌屬與分枝桿菌屬微生物都適用于甾類藥物中間體的生產(chǎn);它們細(xì)胞壁產(chǎn)生的表面活性劑有親水和疏水兩種基團(tuán),能在水相和油相移動(dòng),提高細(xì)胞的耐受力,適用于油水兩相體系發(fā)酵及促進(jìn)分枝桿菌對(duì)甾體化合物底物的攝?。?6-18],擁有完善的甾類降解基因簇、種類豐富的特異性加氧酶、氧化還原酶以及β-氧化酶、確保了微生物對(duì)底物的快速代謝[19-22,32];多數(shù)紅球菌屬與分枝桿菌具有快速生長(zhǎng)特點(diǎn),易培養(yǎng)繁殖,是理想的甾類生物轉(zhuǎn)化媒介。
自1998年第一個(gè)分枝桿菌的M.tuberulosis H37Rv全基因組[23]發(fā)布以來,越來越多的研究機(jī)構(gòu)對(duì)不同分枝桿菌進(jìn)行了全基因組測(cè)序,分析其基因組特征,不斷解析和完善分枝桿菌甾醇降解代謝途徑的各個(gè)關(guān)鍵酶基因功能,初步繪制甾醇代謝圖譜,闡明代謝機(jī)制及明確降解機(jī)制[33-34]。截至目前為止,多數(shù)典型分枝桿菌已經(jīng)完成全基因組測(cè)序(表1)[24],部分進(jìn)行了甾醇關(guān)鍵酶的活性測(cè)定。通過對(duì)不同分枝桿菌進(jìn)行基因組分析,研究發(fā)現(xiàn)分枝桿菌甾體代謝相關(guān)基因聚集成簇。GRIFFIN[25]等在對(duì)M.tuberulosis H37Rv高通量測(cè)序發(fā)現(xiàn)攝取甾醇過程中起作用的基因很多,約60%的重要基因位于簇外的基因組其他位置,因此給系統(tǒng)性研究分枝桿菌代謝途徑帶來極大的挑戰(zhàn)。除此之外,一些快速生長(zhǎng)型分枝桿菌中廣泛存在的同工酶序列與模糊功能基因,也給甾醇降解機(jī)制的解析與甾藥工程菌的開發(fā)構(gòu)建增加了難度[19,26]。
表1 完成測(cè)序的典型甾類代謝微生物
2010年魏?。?7]等以M.neoaurum NWIB-01為菌種,以質(zhì)粒為載體對(duì)該菌株進(jìn)行Fosmid單克隆基因組測(cè)序,通過基因標(biāo)簽的PCR篩選及測(cè)序的方法,得到部分的基因簇序列片段約81 kb,發(fā)現(xiàn)很多甾醇代謝關(guān)鍵酶。關(guān)鍵酶基因ksdd、ksha、kshb的序列分別為1056 bp、1701 bp、1188 bp。由于分枝桿菌基因組復(fù)雜的特殊結(jié)構(gòu)以及有限的測(cè)序技術(shù)條件,這些先導(dǎo)性基因組學(xué)研究難以拼接完整的基因簇,可能錯(cuò)失一些重要的起調(diào)控作用基因的信息。
2014年,姚抗[28]對(duì)M.neoaurum ATCC 25795全基因組進(jìn)行了測(cè)序和分析,結(jié)合基因組測(cè)序的重要信息,對(duì)代謝通路分子的認(rèn)識(shí),分別得出三種關(guān)鍵代謝酶,兩個(gè)編碼CHO的基因choM1(編碼1746 bp,完整編碼581個(gè)氨基酸)與choM2(編碼1617 bp,編碼538個(gè)氨基酸)以及一個(gè)編碼3β-HSD(編碼1065 bp,編碼354個(gè)氨基酸)基因;編碼KstD的基因MN-ksD1(編碼1701 bp,編碼566個(gè)氨基酸)、基因MN-ksD2(編碼1677 bp,編碼558個(gè)氨基酸)及基因MN-ksD3(編碼1548 bp,編碼515個(gè)氨基酸),編碼KSH的基因還原酶MN-KshB(編碼1 069 bp基,編碼351個(gè)氨基酸)及加氧酶MN-KshA(編碼1 188 bp,編碼395個(gè)氨基酸)。
2017年,徐玲霞[29]等通過Illumina高通量測(cè)序技術(shù)對(duì)M.neoaurum MN4和M.neoaurum MN2進(jìn)行全基因組測(cè)序,采用NGSQCTool kit軟件對(duì)原始數(shù)據(jù)進(jìn)行過濾,再通過Velvet軟件對(duì)過濾后的數(shù)據(jù)進(jìn)行組裝,基因組序列如下特點(diǎn):
M.neoaurum MN4基因組大小為539.053 bp,其基因組共包含5 049個(gè)基因,46個(gè)tRNA,3個(gè)(5 s-16 s-23 s)rRNA;4920編碼序列,其中992個(gè)CDS編碼保守的假定蛋白,3 684個(gè)CDS編碼具有明確功能的產(chǎn)物;編碼序列占整個(gè)基因組的90.6%,平均長(zhǎng)度為992,GC含量為66.9%,假基因個(gè)數(shù)為325個(gè)。
M.neoaurum MN2基因組的大小為538.301bp,其基因組包含5 049個(gè)基因,46個(gè)tRNA,3個(gè)(5 s-16 s-23 s)rRNA,4 890個(gè)編碼序列;其中1 435個(gè)CDS編碼保守的假定蛋白,3455個(gè)CDS編碼具有明確功能的產(chǎn)物;編碼序列占整個(gè)基因組的89.8%,平均長(zhǎng)度為989,GC含量為66.8%,假基因個(gè)數(shù)為105個(gè)。
通過對(duì)兩株菌進(jìn)行基因組進(jìn)行分析分別得到16條和17條次級(jí)代謝產(chǎn)物基因簇,在MN2菌株中發(fā)現(xiàn)與甾醇提取相關(guān)基因choM1、choM2、3βhsd,MN4中發(fā)現(xiàn)關(guān)鍵基因choM1、choM2、3β-hsd以及Kstd-1、Kstd-2、KstA-1、KstB。
2018年,本實(shí)驗(yàn)室對(duì)分枝桿菌M.neoaurum HGMS2進(jìn)行全基因組測(cè)序[30],發(fā)現(xiàn)其基因組中含有1條染色體,基因組總長(zhǎng)度為5 421 383 bp,5 133個(gè)基因,占基因組的92.10%。含有5 078個(gè)具有編碼功能的編碼序列,5 001個(gè)編碼基因,77個(gè)假定基因,55個(gè)RNA,6個(gè)rRNA(2個(gè)5S,2個(gè)16S,2個(gè)23S),46個(gè)tRNAs,3個(gè)ncRNA。菌株HGMS2基因組圈圖如圖1所示。
圖1 菌株HGMS2基因組圈圖
以NRRL B-3805為參考基因,發(fā)現(xiàn)菌株M.neoaurum HGMS2多出512個(gè)堿基對(duì),無插入突變,32個(gè)缺失突變和6個(gè)位于編碼序列區(qū)域的Indel?;谠摼耆蚪M序列得到編碼三種關(guān)鍵酶的六個(gè)基因,分別為:編碼3-甾酮-1,2脫氫酶的基因KsdD211為1 692 bp、9α-羥化酶的基因KshA226約為1 185 bp、基因KshA395約為1 149 bp、基因KshB122約為1 056 bp、編碼末端碳單氧化酶的基因Mono164約為1 254 bp和基因Mono1973約為1 275 bp。通過基因組信息,預(yù)測(cè)了三種膽固醇氧化酶(ChoM組1:ChoM1、ChoM2和hsd),兩種單加氧酶(Mon組2:Mon164和Mon197),一組側(cè)鏈降解酶,一組3-酮甾體-1,2-脫氫酶(KstD;組4:KstD211)和3個(gè)3-酮甾體-9a-羥化酶(Ksh;組5:KshA226、KshA395和KshB122)。一個(gè)編碼Mon164、KstD211、KshA226、KshB122和β脂肪酸的基因簇,共同參與M.neoaurum HGMS2中的植物甾醇降解途徑。
ASMAR[31]等2014年對(duì)分枝桿菌M.DSM 44074菌株進(jìn)行了基因組測(cè)序,其基因編碼量為5 112 765 bp,(編碼率為92.35%,共鑒定出5 274個(gè)基因,其中239個(gè)(4.53%)編碼假定蛋白,822個(gè)(15.59%)編碼假定蛋白。此外,5 220個(gè)基因在COG數(shù)據(jù)庫中至少匹配一個(gè)序列。
研究發(fā)現(xiàn)分枝桿菌可降解甾醇類物質(zhì)并將其作為碳源,先降解甾醇的側(cè)鏈,其次多步催化反應(yīng)降解為二氧化碳和水。如新金分枝桿菌轉(zhuǎn)化植物甾醇產(chǎn)AD、ADD、9-OH-AD、1,4-HBC、4-HBC等甾體藥物中間體。甾醇轉(zhuǎn)化過程中由于代謝分支多,步驟長(zhǎng)?;诨蚪M學(xué)獲得分枝桿菌的關(guān)鍵基因簇序列,針對(duì)代謝途徑中的關(guān)鍵基因進(jìn)行敲除改造微生物分枝桿菌,轉(zhuǎn)化植物甾醇產(chǎn)AD、ADD、9-OH-AD、1,4-HBC和4-HBC等甾體藥物中間體代謝產(chǎn)物,采用LC-MS、TLC、HPLC等代謝組學(xué)技術(shù)定性定量的方法,分析這些菌株甾醇轉(zhuǎn)化代謝途徑及組分,確定對(duì)應(yīng)的關(guān)鍵酶是否調(diào)控植物甾醇代謝途徑。
魏?。?7]等對(duì)利用NI+親和層析柱分別得到產(chǎn)物3-甾酮-△1-脫氫酶,3-Ketosteroid-9α-羥化酶還原酶。分別通過對(duì)野生菌型及KSdD基因敲除菌進(jìn)行植物甾醇轉(zhuǎn)化進(jìn)行實(shí)驗(yàn),采用基于高分辨質(zhì)譜平臺(tái)的非靶向代謝組學(xué)方法得到野生菌主要積累ADD而KSdD基因敲除菌主要積累AD,證實(shí)KSdD是AD到ADD轉(zhuǎn)化的主要酶。
姚抗[28]等通過敲除同工酶的編碼基因,構(gòu)建六株不同的工業(yè)分枝桿菌,分析目標(biāo)基因在不同底物誘導(dǎo)時(shí)的轉(zhuǎn)錄差異,利用代謝組學(xué)證實(shí)這些酶在分枝桿菌中的甾醇代謝功能。通過出發(fā)菌株M.neoaurum ATCC 257795的基因組信息分析,鑒定出編碼Kstd的基因,構(gòu)建9-OHAD高效生產(chǎn)菌株轉(zhuǎn)化植物甾醇,運(yùn)用GC-MS技術(shù)分析MN-Kstd敲除菌中生成的未知代謝產(chǎn)物,得出3-甾酮-△1-脫氫酶(Kstds)是催化9-OHAD轉(zhuǎn)化為不穩(wěn)定中間體9-OHADD反應(yīng)的關(guān)鍵酶。運(yùn)用TLC、HPLC及LC/MS技術(shù)對(duì)MN-kshA敲除菌代謝產(chǎn)物分析得到MN-KshA1為KSH的關(guān)鍵加氧酶,對(duì)9α-羥基化過程起著無可替代的意義。
徐玲霞[29]等基于分枝桿菌M.neoaurum MN2和MN4全基因信息測(cè)序進(jìn)行甾醇降解關(guān)鍵基因簇分析,通過HPLC技術(shù)分析MN2和MN4植物甾醇轉(zhuǎn)化產(chǎn)物得到代謝基因突變導(dǎo)致突變株MN2能夠耐受高底物的植物甾醇使得其AD與ADD的比例為13∶1,MN4中轉(zhuǎn)成AD與ADD的比例為20∶1。
WANG[30]等基于分枝桿菌Mycobacterium neoaurum sp HGMS2基因組的分析,鑒定出轉(zhuǎn)化植物甾醇關(guān)鍵基因,利用TLC技術(shù)驗(yàn)證KshD基因表達(dá)的產(chǎn)物酶的活性;HPLC技術(shù)分析得到9α-羥基化酶基因編碼的蛋白KsnA395、KsnB122有活性,KsnA266無活性。
分枝桿菌對(duì)甾醇體的代謝有很好的生物轉(zhuǎn)化功能,近幾年對(duì)分枝桿菌不同菌株進(jìn)行基因組測(cè)序,深度挖掘測(cè)序數(shù)據(jù)去發(fā)現(xiàn)其代謝通路關(guān)鍵酶基因,探索其關(guān)鍵基因功能。推測(cè)關(guān)鍵酶在分枝桿菌的代謝途徑的分解機(jī)制,通過分析其代謝組學(xué),提高甾體藥物中間體的產(chǎn)量。分枝桿菌甾醇降解分子機(jī)制的相關(guān)研究遠(yuǎn)遠(yuǎn)還不夠,還需要對(duì)分枝桿菌降解甾醇的分子生物學(xué)機(jī)制進(jìn)行深入的研究。相信隨著微生物代謝甾體的機(jī)制及其功能簇基因不斷被揭示,微生物轉(zhuǎn)化法在甾體藥物的生產(chǎn)中將發(fā)揮越來越重要的作用。