劉 超,宋瑾怡,薛艷紅,熊 澤,劉士平
(三峽大學(xué) 生物與制藥學(xué)院,湖北 宜昌443002)
草酸青霉(P.oxalicum)是一種廣泛分布于土壤、根際、食物及動(dòng)植物體內(nèi)等環(huán)境中的絲狀真菌[1],可防治番茄枯萎病、油菜菌核病、棉花炭疽病、柑橘綠霉病等20余種植物真菌性病害[2-3]。草酸青霉在溶磷、分解纖維素和生物修復(fù)等方面也發(fā)揮著重要作用[4-6]。2013年,我國測定第一個(gè)草酸青霉菌株(114-2)的全基因組序列,并完成基因注釋:其基因組共約30 MB,預(yù)測有10 013個(gè)基因,編碼9 979個(gè)蛋白質(zhì)[7-9]。截止2020年4月,在GenBank數(shù)據(jù)庫中共有6條草酸青霉的全基因組序列[7,10-11]。
前期從三峽河岸帶地區(qū)篩選出兩株草酸青霉SG-4和SJ-3,發(fā)現(xiàn)其對柑橘致腐菌指狀青霉有強(qiáng)烈抑制作用[12]。通過活性追蹤和系統(tǒng)分離鑒定,得知其抑菌物質(zhì)是一種新型線性五肽(圖1),結(jié)構(gòu)是:O-Me-Baba-N-Me-Thr-Thr-N-Me-Val-Ser,其中Baba是β-氨基丁酸。進(jìn)一步研究表明該肽活性穩(wěn)定,對人體安全,是一種潛在抗生素和食品添加劑[12]。
自然界中寡肽的生物合成途徑有兩種,分別是核糖體途徑和非核糖體途徑[13-14]。前者指通過依賴核糖體的翻譯途徑合成寡肽,是一種初生代謝,在其基因組中一般存在目標(biāo)寡肽的重復(fù)序列;后者是由一種不依賴于翻譯途徑的非核糖體肽合成酶(NRPS,non-ribosomal peptide synthetase)所催化,是一種次級代謝,它是寡肽合成的主要途徑[15-16]。許多非核糖體肽是常見的抗生素,它們在醫(yī)藥、食品工業(yè)發(fā)揮了巨大作用[17-19]。根據(jù)NRPS的催化特點(diǎn)和寡肽的結(jié)構(gòu),開發(fā)出一系列基于NRPS基因序列來分析預(yù)測寡肽的軟件,如fungiSMASH、NRPS predictor、Norine等,這些軟件為寡肽生物合成途徑研究提供了有利條件[20-22]。
為揭示新型五肽在草酸青霉中的合成機(jī)制,本研究測定了3株不同草酸青霉菌株的轉(zhuǎn)錄組序列,通過分析差異基因,從表達(dá)水平上確定候選合成基因簇,為剖析新型五肽合成機(jī)理提供了實(shí)驗(yàn)依據(jù)。
圖1 草酸青霉中的新型線性五肽Fig.1 New linear pentapeptide in P.oxalicum
BS-224s電子天平:德國賽多利斯公司產(chǎn)品;SW-CJ-2FD型雙人實(shí)驗(yàn)操作臺:蘇州凈化設(shè)備廠產(chǎn)品;XPX-9052 MBE數(shù)顯培養(yǎng)箱:上海博訊實(shí)業(yè)有限公司醫(yī)療設(shè)備廠產(chǎn)品;ZQZY-85BN全自動(dòng)控溫?fù)u床:上海知楚儀器有限公司產(chǎn)品;Master-s15和泰純水儀:上海和泰儀器有限公司產(chǎn)品;MyCyclerTMThermal PCR儀:美國BIO-RAD公司產(chǎn)品;GDS-8000凝膠成像系統(tǒng):美國UVP公司產(chǎn)品;Allegra 64R臺式高速冷凍離心機(jī):美國BECKMAN公司產(chǎn)品;DYCP-31DN水平電泳儀:北京市六一儀器廠產(chǎn)品;YM30F不銹鋼智能型立式電熱蒸汽消毒器:上海三申醫(yī)療器械有限公司產(chǎn)品;島津高效液相色譜儀紫外-可見光檢測器(SPD-16),C8液相柱(YMCTriart C8 250 mm×4.6 mm):島津儀器蘇州有限公司產(chǎn)品。
土豆:市售;葡萄糖:科密歐化學(xué)試劑有限公司產(chǎn)品;瓊脂:金燕海洋生物股份有限公司產(chǎn)品;色譜級乙腈:Tedia公司產(chǎn)品;真菌RNA提取試劑盒:美國Omega Bio-Tek公司產(chǎn)品;GoldenstarTMRT6 cDNA Synthesis Kit Ver.2和T3 Super PCR Mix:均為北京擎科新業(yè)生物技術(shù)有限公司產(chǎn)品。
草酸青霉SG-4和SJ-3:來源于菌株均系三峽河岸帶植物疏花水柏枝(Myricaria laxiflora)的內(nèi)生真菌;114-2:來源于山東大學(xué)微生物技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,由本實(shí)驗(yàn)室自行分離獲得。以上菌株均保藏于4℃的PDA固體斜面培養(yǎng)基。PDA固體培養(yǎng)基:土豆200 g,葡萄糖20 g,瓊脂20 g,水1 000 mL,pH值自然,121℃滅菌20 min。
將保存在PDA固體斜面的3株草酸青霉菌種活化培養(yǎng)4 d,采用無菌操作取1環(huán)孢子接種于裝有200 mL的PDA液體培養(yǎng)基三角搖瓶中(總?cè)莘e500 mL),于28℃、120 r/min條件下培養(yǎng)7 d,采用Omega試劑盒提取總RNA,提取方法按試劑盒的操作方法進(jìn)行。
將200 mL PDA液體中培養(yǎng)好的菌體抽濾,獲取不同培養(yǎng)時(shí)間的菌絲和發(fā)酵液,菌絲烘干后稱量。發(fā)酵液使用等體積無水乙醇混勻沉淀24 h,將上清液旋蒸凍干獲得粗提物,使用純水將粗提物配制成質(zhì)量濃度為5 mg/mL的溶液。采用島津高效液相色譜儀紫外-可見光檢測器(SPD-16),YMCTriart C8 250 mm×4.6 mm、粒徑5μm的C8色譜柱進(jìn)行反向高效液相分析。流動(dòng)相A為乙腈,流動(dòng)相B為純水,超聲脫氣后使用;檢測波長為210 nm;進(jìn)樣體積為80μL;流量為1mL/min,柱箱溫度為35℃,梯度洗脫:0~20 min,B體積分?jǐn)?shù)由90%變?yōu)?%。記錄5~6 min處五肽相對峰面積。
將質(zhì)量檢測合格的RNA樣品使用BGISEQ-500,進(jìn)行高通量RNA-Seq,具體過程如下:先用帶OligodT的磁珠富集有polyA尾巴的mRNA,再用DNA探針雜交rRNA,利用RNaseH選擇性消化DNA/RNA雜交鏈,再用DNaseI消化掉DNA探針,純化后即得到所需RNA。然后將RNA片段化,用隨機(jī)的N6引物進(jìn)行反轉(zhuǎn)錄,進(jìn)一步形成雙鏈DNA。將雙鏈DNA末端補(bǔ)平并進(jìn)行5′端磷酸化,3′端形成突出一個(gè)“A”的粘末端,再連接一個(gè)3′端有凸出“T”的鼓泡狀的接頭。然后連接產(chǎn)物通過特異的引物進(jìn)行PCR擴(kuò)增和上機(jī)測序。
轉(zhuǎn)錄組數(shù)據(jù)以草酸青霉114-2為參考基因組進(jìn)行有參分析,用過濾軟件SOAPnuke進(jìn)行統(tǒng)計(jì),用Trimmomatic進(jìn)行過濾,得到高質(zhì)量數(shù)據(jù)(clean reads);使用HISAT軟件和Bowtie2軟件將clean reads分別比對到參考基因組和參考基因序列上。根據(jù)比對結(jié)果,利用RSEM軟件定量分析,并以FPKM計(jì)算基因表達(dá)水平。差異表達(dá)分析重點(diǎn)在于找出樣本之間差異表達(dá)的基因,并對這些基因進(jìn)行深入挖掘分析。在分析中,差異表達(dá)基因默認(rèn)定義為FDR≤0.001且倍數(shù)差異在1倍以上的基因。篩選獲得的差異表達(dá)基因,根據(jù)GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)注釋進(jìn)行結(jié)果分類,同時(shí)使用R軟件中的phyper函數(shù)進(jìn)行富集分析。
用 線 上 工 具antiSMASH(https://fungismash.secondarymetabolites.org/#!/start?tdsourcetag=s_pcqq_aiomsg)分析草酸青霉114-2的基因組序列,統(tǒng)計(jì)草酸青霉次生代謝產(chǎn)物基因簇,根據(jù)線上產(chǎn)物預(yù)測功能及NRPS的A型結(jié)構(gòu)域,結(jié)合轉(zhuǎn)錄組表達(dá)量分析NRPS基因簇。
使用Oligo7軟件設(shè)計(jì)引物,由生工生物工程(上海)股份有限公司合成,使用反轉(zhuǎn)錄試劑盒將所提RNA反轉(zhuǎn)錄成cDNA,添加引物進(jìn)行RT-PCR驗(yàn)證,所用的引物序列見表1。
表1 實(shí)驗(yàn)中所用的引物序列Table 1 Primer sequences in the experiment
將SG-4、SJ-3和114-2這3株草酸青霉菌在PDA液體培養(yǎng)基中培養(yǎng)7天,收集發(fā)酵液后進(jìn)行高效液相色譜分析發(fā)現(xiàn),菌株114-2不產(chǎn)線性五肽,相比之下,來自于三峽河岸帶的SG-4和SJ-3線性五肽產(chǎn)量很高(圖2(a)),同時(shí)對指狀青霉顯示出很強(qiáng)的抑制效應(yīng)(圖2(b)),其中菌株SJ-3的產(chǎn)量明顯高于菌株SG-4(圖2(a))。
為了明確線性五肽的合成特點(diǎn),以菌株SG-4為對象,分析了菌體生長規(guī)律和合成五肽的時(shí)期。結(jié)果顯示,菌體的生長從第6天開始進(jìn)入對數(shù)生長期(圖3(a)),而線性五肽在第4天開始累積,第8天達(dá)到最大值(圖3(b)),符合次生代謝產(chǎn)物的特點(diǎn)。由于大多數(shù)寡肽由非核糖體肽合成酶(NRPS,non-ribosomal peptide synthetase)所催化,因此推測五肽極有可能由NRPS基因簇負(fù)責(zé)合成。
圖2 不同草酸青霉的五肽產(chǎn)量及抑菌效果Fig.2 Pentapeptide productionand antifungal effect of P.oxalicum strains
圖3 SG-4的生長曲線和五肽的合成時(shí)間Fig.3 Growth curve of SG-4 and synthesis time of pentapeptide
為明確線性五肽的生物合成機(jī)制,將上述3株草酸青霉在PDA培養(yǎng)基上生長6 d后提取其總RNA,質(zhì)檢合格后在武漢華大基因科技有限公司使用BGISEQ-500平臺進(jìn)行了轉(zhuǎn)錄組測序。由于114-2有完整的序列注釋信息,故在測序時(shí)使用它為參照序列進(jìn)行分析。
將測序的原始數(shù)據(jù)(raw reads)中低質(zhì)量、接頭污染以及未知堿基含量過高的數(shù)據(jù)過濾后,平均每個(gè)菌株產(chǎn)生了4 365萬條高質(zhì)量數(shù)據(jù)(clean reads),平均容量達(dá)6.55 GB,高質(zhì)量數(shù)據(jù)比例接近97%。將所獲得的clean reads使用HISAT進(jìn)行參考基因組序列比對,平均比對率達(dá)到91.65%(表2)。上述結(jié)果表明,此次測序的質(zhì)量有保證,結(jié)果可靠,而且3株草酸青霉的轉(zhuǎn)錄組序列均與參考基因組序列匹配程度高。
表2 轉(zhuǎn)錄組測序概況Table 2 A survey of transcriptome sequencing
按照差異的倍數(shù)(|log2(Fold Change)|)和錯(cuò)誤發(fā)現(xiàn)率(FDR)來篩選差異表達(dá)基因,分析中將同時(shí)滿足|log2(Fold Change)|≥1且FDR≤0.001的轉(zhuǎn)錄本確定為差異表達(dá)基因[23]。3個(gè)轉(zhuǎn)錄組中的表達(dá)發(fā)生顯著變化的基因數(shù)如表3所示。
表3 差異表達(dá)的基因數(shù)Table 3 Number of genes differentially expressed
上述結(jié)果表明,產(chǎn)五肽的菌株SG-4和SJ-3,其差異表達(dá)基因比例只有16.32%,明顯比不產(chǎn)五肽的菌株114-2要少,這說明產(chǎn)五肽菌株的遺傳背景有一定的共性。因此,在后期的比較中重點(diǎn)關(guān)注在SG-4和SJ-3中有相同變化趨勢的基因,即114-2對SG-4及114-2對SJ-3中的2 239個(gè)基因(圖4)。
圖4 在114-2對SG-4和114-2對SJ-3中的差異表達(dá)基因Fig.4 Differentially expressed genes in 114-2 vs SG-4 and 114-2 vs.SJ-3
對于3株草酸青霉(114-2,SG-4和SJ-3)共同差異表達(dá)的基因分別采用GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genesand Genomes)分類,富集分析了其可能的功能及所參與的細(xì)胞代謝過程。GO分類表明,上述1 823個(gè)基因主要參與生物調(diào)節(jié)、細(xì)胞成分組織或生物發(fā)生、細(xì)胞進(jìn)程、代謝過程、大分子復(fù)合物、細(xì)胞膜、細(xì)胞器及催化活性等生物學(xué)過程中(圖5(a))。而KEGG分類表明差異集中在糖代謝、脂代謝、氨基酸代謝、物質(zhì)轉(zhuǎn)運(yùn)及信號傳導(dǎo)過程(圖5(b))。GO富集表明,差異基因主要在調(diào)節(jié)催化活性、膜結(jié)構(gòu)與功能、氧化還原代謝等過程中發(fā)揮作用(圖5(c)),KEGG富集表明,差異基因主要集中在抗生素合成、脂肪酸分解和氨基酸代謝等途徑(圖5(d))。
圖5 差異基因表達(dá)分析Fig.5 Differential gene expression analyses
由于草酸青霉所合成的線性五肽很有可能是由NRPS催化合成,因此利用線上分析工具antiSMASH[20],分析數(shù)據(jù)庫內(nèi)草酸青霉114-2的全基因組序列中可能的NRPS基因簇,發(fā)現(xiàn)共有33個(gè)可能的NRPS。將這些NRPS在有參轉(zhuǎn)錄組中對應(yīng)后,分析其相應(yīng)的表達(dá)量(表4)。分析結(jié)果表明,在33個(gè)NRPS中,共有16個(gè)NRPS的表達(dá)量與五肽合成的變化趨勢一致(這16個(gè)NRPS在表4中用粗體給出),因此篩選范圍進(jìn)一步縮小。其中PDE_01071和PDE_01077屬同一個(gè)基因簇,因此共篩選出15個(gè)基因簇。
為保證篩選結(jié)果的正確性,對部分候選基因進(jìn)行了RT-PCR驗(yàn)證。結(jié)果表明,大多基因的表達(dá)均與測序結(jié)果一致,尤其是PDE_01071基因簇,該基因簇中有9個(gè)基因的表達(dá)在3株菌株中均存在明顯差異,相對于不產(chǎn)五肽的草酸青霉114-2,均為上調(diào)基因,而且RT-PCR結(jié)果與測序表達(dá)結(jié)果完全一致(圖6(a)),特別是結(jié)合了不同時(shí)間的表達(dá)情況,在生長4 d時(shí)該基因簇基本不表達(dá)(圖6(b)),與五肽的生產(chǎn)時(shí)間相吻合,而且該基因簇中有多個(gè)甲基轉(zhuǎn)移酶,說明該基因簇可能參與草酸青霉中線性五肽的合成。
表4 草酸青霉中所有候選NRPS基因的表達(dá)量Table 4 Expression of all candidate NRPS genes in P.oxalicum
圖6 RT-PCR驗(yàn)證表達(dá)結(jié)果Fig.6 RT-PCR to verify the expression
本研究基于BGISEQ-500測序平臺,分析比較了3株草酸青霉在培養(yǎng)7 d時(shí)的轉(zhuǎn)錄組測序數(shù)據(jù),并基于草酸青霉114-2的全基因組進(jìn)行了有參比對,同時(shí)對差異表達(dá)基因進(jìn)行了分析;根據(jù)五肽的合成特點(diǎn),篩選出一個(gè)最有可能負(fù)責(zé)草酸青霉中五肽合成的NRPS,即PDE_01071基因簇。值得一提的是,該結(jié)果與正在進(jìn)行的不同生長時(shí)期的無參轉(zhuǎn)錄組測序結(jié)果相吻合(另文發(fā)表),所有這些嘗試為明確其生物合成機(jī)制奠定了基礎(chǔ)。后面的工作中,需對基因簇成員進(jìn)行針對性誘變,在明確酶活性和基因功能的基礎(chǔ)上,對其合成機(jī)理進(jìn)行解析。另外,NRPS催化寡肽合成的過程和機(jī)理很復(fù)雜,目標(biāo)產(chǎn)物是五肽,可是表3中候選NRPS的A結(jié)構(gòu)域的數(shù)字很少有等于5的,這可能是由于在合成中采用了迭代模式。