曹然,羅曉霞,張利莉*
(1塔里木大學(xué)生命科學(xué)學(xué)院,新疆 阿拉爾 843300)
(2塔里木盆地生物資源保護利用兵團重點實驗室,新疆 阿拉爾 843300)
1943年,鏈霉菌首次由WAKSMAN S A等描述[1]。鏈霉菌是最大的放線菌屬,已知放線菌所產(chǎn)抗生素的90%由本屬產(chǎn)生。鏈霉菌能產(chǎn)生結(jié)構(gòu)新穎、豐富的次級代謝產(chǎn)物,是挖掘生物活性產(chǎn)物的寶貴資源[2-3]。近年來,隨著國內(nèi)外研究學(xué)者對鏈霉菌活性產(chǎn)物挖掘的不斷深入,鏈霉菌新物種研究逐漸成為新方向。鏈霉菌新物種的分離源以特殊環(huán)境土壤為主,其他分離源還包括海洋、沙漠、動植物體內(nèi)等多種特殊的環(huán)境[4-6]。隨著國內(nèi)外研究學(xué)者對鏈霉菌新物種的深入研究,鏈霉菌新物種發(fā)表數(shù)量呈現(xiàn)上升趨勢。目前,已有超過850個鏈霉菌新物種被發(fā)表。對于活性代謝產(chǎn)物和具有應(yīng)用價值的鏈霉菌新物種研究逐漸成為新物種發(fā)表的重要創(chuàng)新點。我國地廣物博,存在各種特殊環(huán)境,有待挖掘的鏈霉菌資源極為豐富,這也是近年來我國鏈霉菌新物種發(fā)表數(shù)量處于世界前列的重要原因。鏈霉菌新物種的挖掘為研究鏈霉菌次級代謝產(chǎn)物奠定了良好的基礎(chǔ)。
近年來,越來越多的方法和手段被國內(nèi)外研究學(xué)者用于微生物次級代謝產(chǎn)物的挖掘,且傳統(tǒng)的研究方法已經(jīng)難以得到滿意的結(jié)果,因此對微生物進行基因水平的研究逐漸成為新的研究方向?;诨蛩降拇渭壌x產(chǎn)物的挖掘主要通過對微生物菌株進行全基因組測序,將測序后的數(shù)據(jù)進行基因組組裝和注釋后,運用相關(guān)生物信息學(xué)軟件對其進行分析。通過對次級代謝產(chǎn)物生物合成基因簇及相關(guān)的預(yù)測明確微生物菌株的次級代謝潛力,從而更有針對性地進行深度挖掘,因此基于基因水平挖掘次級代謝產(chǎn)物已成為新藥挖掘的突破點。
TRM68367是本實驗分離自新疆阿克蘇溫宿縣臺蘭河淤泥的鏈霉菌新物種,并對蠟狀芽孢桿菌具有抑菌活性。本研究基于Illumina Hiseq 2000測序平臺對菌株進行全基因組測序及生物信息學(xué)分析,為豐富微生物物種資源庫、挖掘結(jié)構(gòu)新穎、生物活性較強、具有特殊作用機制的天然產(chǎn)物提供理論依據(jù)。
1.1.1 菌株及來源
Streptomyces wensuensisTRM68367菌株,分離自新疆阿克蘇溫宿縣臺蘭河淤泥,保藏于塔里木盆地生物資源保護利用兵團重點實驗室、中國典型培養(yǎng)物保藏中心和比利時LMG菌種保藏中心,菌株保藏編號為Streptomyces wensuensisTRM68367T=CCTCC AA 2020004T=LMG 31944T。
1.1.2 培養(yǎng)基
(1)高氏一號固體培養(yǎng)基
可溶性淀粉20.0 g、磷酸氫二鉀0.5 g、硝酸鉀1.0 g、七水硫酸鎂0.5 g、硫酸亞鐵0.1 g/L、瓊脂16.0 g、水1 L、pH 7.2~7.4。
(2)真菌:PDA培養(yǎng)基
土豆 200.0 g、葡萄糖 20.0 g、瓊脂 17.0 g、水 1 L、pH 7.0。
細(xì)菌:MHA培養(yǎng)基
牛肉提取物2.0 g、酪蛋白水解物17.5 g、淀粉2.0 g、瓊脂17.0 g、pH 7.3±0.1。
(3)TSB液體培養(yǎng)基
胰蛋白胨17.0 g、蛋白胨3.0 g、葡萄糖2.5 g、氯化鈉5.0 g、磷酸氫二鉀2.5 g、水1 L、pH 7.1~7.5。
1.1.3 主要試劑
10% SDS、5 mol/L NaCl、10% CTAB、3 mol/L 醋酸鈉用于基因組DNA的提取,dNTP、Easy Taq酶、Easy Taqbuffer、DMSO、16S rRNA擴增引物27F(5’-GAGTTTGATCCTGGCTCAG-3’)和 1492R(5’-GGTTACCTTGTTACGACTT-3’)。
1.1.4 主要儀器
主要儀器設(shè)備見表1。
表1 主要儀器及設(shè)備
1.2.1 菌株抑菌活性實驗
第一步:發(fā)酵液待測液制備:向三角瓶中裝入150 mL高氏一號液體發(fā)酵培養(yǎng)基,120℃,30 min滅菌,挑取三個菌餅接入發(fā)酵培養(yǎng)基,30℃,180 r/min培養(yǎng)5 d。發(fā)酵液經(jīng)8000 r/min,10 min離心后,上清液經(jīng)過0.22 μm濾膜除菌得到無菌發(fā)酵液。第二步:病原菌菌懸液的準(zhǔn)備:配制40%甘油,吸取甘油至培養(yǎng)好的病原菌平板中,用無菌竹簽刮取菌絲,用移液槍將菌懸液移入無菌玻璃瓶中。將孢子懸浮液搖勻,分裝至無菌甘油管中,-20℃保藏。第三步:真菌病原菌平板的制作:吸取200 μL病原菌菌懸液涂布于PDA培養(yǎng)基。采用濾紙片法檢測放線菌發(fā)酵液對病原菌的抑制作用。吸取200 μL發(fā)酵液滴加在濾紙片上,將濾紙片放在病原菌平板上,真菌放置28℃培養(yǎng)箱,細(xì)菌放置在37℃培養(yǎng)箱中培養(yǎng),測量抑菌圈大小。細(xì)菌病原菌平板的制作:吸取200 μL病原菌菌懸液涂布于MHA培養(yǎng)基。采用濾紙片法檢測放線菌發(fā)酵液對病原菌的抑制作用。吸取200 μL發(fā)酵液滴加在濾紙片上,將濾紙片放在病原菌平板上,真菌放置28℃培養(yǎng)箱,細(xì)菌放置在37℃培養(yǎng)箱中培養(yǎng),測量抑菌圈大小。
1.2.2 菌株培養(yǎng)及基因型特征鑒定
將TRM68367劃線接種到高氏一號固體培養(yǎng)基中,30℃活化5 d后,挑取三個菌餅將其轉(zhuǎn)接到TSB液體培養(yǎng)基中,30℃,180 r/min培養(yǎng)3 d后于50 mL離心管收集菌絲體,經(jīng)8000 r/min,10 min離心后棄去上清夜保留菌絲體進行基因組DNA提取。菌株基因組 DNA采用10% CTAB法進行提取[7]。 以TRM68367基因組DNA為模板,PCR擴增菌株16S rRNA,通過克隆測序獲得菌株16S rRNA基因序列,經(jīng)EzBioCloud數(shù)據(jù)庫比對,采用MEGA 7.0軟件[8]構(gòu)建系統(tǒng)進化樹。
1.2.3 全基因組測序及基因組組裝
將提取好的TRM68367基因組DNA經(jīng)1%瓊脂糖凝膠電泳檢測,并用KAIKO K5800超微量分光光度計檢測基因組DNA的濃度。將合格的樣品送往上海派森諾生物信息科技有限公司進行全基因組測序?;贗llumina Hiseq 2000測序平臺,利用第二代測序技術(shù)對其進行全基因組測序,對基因組數(shù)據(jù)采用SOAP denovo 1.05軟件進行拼接,AbySS 2.0軟件進行注釋分析。
1.2.4 溫宿鏈霉菌TRM68367完整基因組注釋與分析
1.2.4.1 蛋白編碼基因預(yù)測
采用 GeneMarkS[9]和 Glimmer 3.0 軟件對全基因組序列進行基因組ORFs預(yù)測。GeneMarkS用于細(xì)菌基因組的蛋白質(zhì)編碼基因預(yù)測。此軟件預(yù)測方法通過GeneMark.hmm建立相應(yīng)的統(tǒng)計模型,利用序列中核酸使用的頻率表矩陣作為基礎(chǔ),來預(yù)測序列中編碼區(qū)域。
1.2.4.2 非編碼RNA預(yù)測
使用 tRNAscan-SE 軟件[10]預(yù)測 tRNA 區(qū)域和tRNA的二級結(jié)構(gòu)。原核生物的rRNA分為三類:5S rRNA、16S rRNA和23S rRNA,使用RNAmmer軟件[11]預(yù)測rRNA。
1.2.4.3 蛋白編碼基因功能注釋
蛋白編碼基因功能注釋的主要目的是對所有蛋白編碼基因進行功能解析,從而在分子水平上對該物種進行解析。目前常見的基因功能注釋數(shù)據(jù)庫主要有COG,KEGG[12],GO[13]等。
1.2.4.4 次級代謝產(chǎn)物生物合成基因簇預(yù)測
采用 antiSMASH 5.0[14]軟件預(yù)測溫宿鏈霉菌TRM68367次級代謝產(chǎn)物生物合成基因簇,并對次級代謝產(chǎn)物生物合成基因簇進行分析。
由表2可知,菌株TRM68367對蠟狀芽孢桿菌具有顯著的抑菌作用,抑菌圈直徑達(dá)到12.92±0.20 mm。
表2 菌株抑菌活性結(jié)果
將TRM68367基因組DNA于1%瓊脂糖凝膠電泳檢測,結(jié)果見圖1?;?6S rRNA基因序列構(gòu)建的菌株TRM68367與其相鄰菌株的Neighbour-Joining系統(tǒng)進化樹見圖2。
圖1 TRM68367基因組DNA瓊脂糖凝膠電泳圖
圖2 基于16S rRNA基因序列構(gòu)建的菌株TRM68367與其相鄰菌株的Neighbour-Joining系統(tǒng)進化樹
由圖1可知,TRM68367基因組DNA目的條帶單一,基因組DNA提取質(zhì)量較好。TRM68367基因組 DNA 濃度為 32.6 ng/μL,OD260/OD280值為 1.88,DNA無降解、無污染,達(dá)到基因組DNA測序要求,將合格的樣品送往上海派森諾生物信息科技有限公司進行全基因組測序,并對測序數(shù)據(jù)進行基因組拼接及注釋,對注釋后的基因組數(shù)據(jù)進行生物信息學(xué)分析。
對菌株TRM68367的16S rRNA進行比對分析,發(fā)現(xiàn)與Streptomyces hyderabadensisOU-40T菌株最相似,其相似性為97.93%,ANI值為83.62%,DNA-DNA雜交結(jié)果較低,其dDDH值為23.47%。對菌株TRM68367采用鄰近法Neighbour-Joining進行系統(tǒng)進化樹的構(gòu)建,發(fā)現(xiàn)菌株TRM68367呈現(xiàn)獨立的分支,推測其可能為鏈霉菌潛在新物種。
對基因組組裝結(jié)果采用GeneMarkS和Glimmer 3.0軟件預(yù)測TRM68367和S.hyderabadensisOU-40T基因組中的基因組ORFs。使用tRNAScan-SE和RNAmmer軟件預(yù)測TRM68367和S.hyderabadensisOU-40T基因中的存在的tRNA和rRNA,結(jié)果統(tǒng)計見表3。
表3 基因組基本特征
將預(yù)測得到的9186個基因的蛋白序列與COG、KEGG和GO數(shù)據(jù)庫進行比對分析,獲得與各數(shù)據(jù)庫相對應(yīng)的基因功能信息。
KEGG代謝通路是代謝活動潛能及物種生命活動特征的重要工具。通過KEGG代謝通路分類,菌株TRM68367共有2825個基因得到注釋,占總基因的30.75%。
COG按照功能一共可以分為二十五類。TRM68367基因組COG功能注釋圖見3。結(jié)果表明,TRM68367共有5243個蛋白質(zhì)序列在COG數(shù)據(jù)庫中得到注釋,占總蛋白質(zhì)序列的57.07%。由圖3可知,TRM68367預(yù)測得到的蛋白質(zhì)序列注釋主要有:369個基因參與能量生產(chǎn)和轉(zhuǎn)換(energy production and conversion,C),蛋白占比為5.81%;615個基因參與氨基酸的運輸和代謝(amino acid transport and metabolism,E),其蛋白占比為9.68%;605個基因參與碳水化合物的運輸和代謝(carbohydrate transport and metabolism,G),占 9.53%;753個基因參與轉(zhuǎn)錄(transcription,K),蛋白占比為11.86%;362個基因參與復(fù)制、重組和修復(fù)(replication,recombination and repair,L),其蛋白占比為5.7%;343個基因參與無機離子的轉(zhuǎn)運和代謝(inorganic ion transport and metabolism,P),占5.4%;934個基因參與一般功能預(yù)測(general function prediction only,R),其蛋白占比 14.71% 和318個基因參與信號轉(zhuǎn)導(dǎo)機制(signal transduction mechanisms,T),其蛋白占比為5.01%。
圖3 TRM68367的COG功能注釋分類圖
GO總共有三個ontology,分別描述基因的分子功能(molecular function)、細(xì)胞組分(cellular component)及生物學(xué)過程(biological process)。TRM68367基因組的GO功能注釋結(jié)果見圖4。由圖4可知,TRM68367的基因組中共有4649個蛋白質(zhì)序列在GO數(shù)據(jù)庫中得到注釋,占總蛋白質(zhì)序列的50.60%,在細(xì)胞組分方面,主要與膜(membrane)、細(xì)胞(cell)、細(xì)胞組分(cell part)單元有關(guān);在分子功能方面,主要與催化活性(catalytic activity)、結(jié)合(binding)、轉(zhuǎn)運活性(transporter activity)、核酸結(jié)合轉(zhuǎn)錄因子活性(nucleic acid binding transcription factor activity)單元有關(guān);在生物學(xué)過程方面,主要與代謝過程(metabolic process)、細(xì)胞過程(cellular process)、組織過程(single-organism process)、生物調(diào)節(jié)(biological regulation)單元有關(guān),表明菌株活性多集中于酶類、分化及代謝等,該菌株中含有的酶類可能對蠟狀芽孢桿菌的活性產(chǎn)生抑制作用。
圖4 TRM68367的GO功能注釋分類圖
采用antiSMASH 5.0對TRM68367基因組中潛在的次級代謝產(chǎn)物生物合成基因簇進行預(yù)測,TRM68367基因組中的次級代謝產(chǎn)物生物合成基因簇主要類型統(tǒng)計見表4。
表4 TRM68367基因組中次級代謝產(chǎn)物生物合成基因簇類型統(tǒng)計
通過對菌株TRM68367的antiSMASH分析,共預(yù)測到33個潛在次級代謝產(chǎn)物生物合成基因簇,結(jié)果表明TRM68367具有豐富的次級代謝產(chǎn)物生物合成基因簇,菌株含有 NRPS、PKS、terpene、RIPP類基因簇,其中Cluster4、Cluster22、Cluster26和Cluster28為NRPS類基因簇,Cluster4和Cluster28與環(huán)肽類化合物基因簇相似性分別為26%和4%,Cluster22與極光霉素生物合成基因簇相似性為4%,Cluster26與遠(yuǎn)霉素生物合成基因簇的相似性為17%;Cluster12、Cluster16為PKS類基因簇,Cluster12與烷基間苯二酚相生物合成基因簇相似性為100%,Cluster16與孢子色素生物合成基因簇的相似性為75%;Cluster3、Cluster6和Cluster17為terpene類基因簇,Cluster3與hopene生物合成基因簇相似性為76%,Cluster6與versipelostatin生物合成基因簇相似性為5%及Cluster17與土臭素的生物合成基因簇相似性100%;Cluster5為RIPP類基因簇,與informatipeptin生物合成基因簇的相似性為46%;Cluster23為丁內(nèi)酯類抗生素,與新制癌菌素生物合成基因簇的相似性為4%。
通過進一步比對分析發(fā)現(xiàn)Cluster1、Cluster7和Cluster27為二酮哌嗪類基因簇,基因簇類型為CDPS(環(huán)二肽合酶),研究表明,環(huán)二肽合酶參與二酮哌嗪類化合物的生物合成[15]。由于該菌株對蠟狀芽孢桿菌具有抑菌活性,且蠟狀芽孢桿菌是二酮哌嗪類化合物典型的拮抗菌之一,因此可以確定該基因簇是導(dǎo)致菌株對蠟狀芽孢桿菌產(chǎn)生抑菌活性的關(guān)鍵基因簇;Cluster4和Cluster28含有環(huán)肽類化合物生物合成相關(guān)基因,二酮哌嗪類化合物是環(huán)肽類化合物中的一類,發(fā)現(xiàn)該基因簇對蠟狀芽孢桿菌具有顯著的抑制作用,因此可以確定該基因簇對蠟狀芽孢桿菌的活性起到抑制作用;Cluster23含有新制癌菌素核心生物合成基因,新制癌菌素是雙烯二炔類抗生素,是臨床上廣泛應(yīng)用的抗腫瘤藥物,因此可以確定TRM68367是一株能夠產(chǎn)生二酮哌嗪類化合物、環(huán)肽類化合物、新制癌菌素的潛力菌株,值得對其次級代謝產(chǎn)物進行深度挖掘。
通過基因型特征、形態(tài)特征、生理生化特征及化學(xué)特征鑒定菌株TRM68367的分類學(xué)地位[16],與其相似菌株比較存在顯著差異,根據(jù)物種鑒定結(jié)果確定TRM68367代表鏈霉菌屬新物種,將其命名為Streptomyces wensuensisTRM68367。基于16S rRNA基因序列對微生物物種進行鑒定的方式并不能很好的區(qū)分相似種或種內(nèi)親緣關(guān)系,作為物種鑒定的標(biāo)準(zhǔn)不具備更細(xì)致的分辨能力,相關(guān)文獻報道,在細(xì)菌基因組中,物種的16S rRNA基因存在異質(zhì)性,特別是極端環(huán)境來源的微生物,差異更加顯著[17]。16S rRNA基因是細(xì)菌眾多保守基因中的的一個,因此僅僅通過16S rRNA基因序列對物種進行鑒定是不足以的,可以通過對多個管家基因的聯(lián)用和尋找分辨能力更高的物種鑒定標(biāo)準(zhǔn)在一定程度上可以減少偏差和誤導(dǎo),能夠更快速的對相似種或種內(nèi)親緣關(guān)系進行鑒定,使更多物種資源都得以利用[18]。
TRM68367是一株分離自新疆阿克蘇溫宿縣臺蘭河淤泥的鏈霉菌新物種,對其進行活性篩選發(fā)現(xiàn)該菌株對蠟狀芽孢桿菌具有抑菌活性,因此對該菌株進行全基因組測序及生物信息學(xué)分析,通過對基因組次級代謝產(chǎn)物生物合成基因簇的預(yù)測發(fā)現(xiàn),菌株TRM68367具有生物活性廣泛的次級代謝產(chǎn)物生物合成基因簇,如:產(chǎn)二酮哌嗪類化合物,蠟狀芽孢桿菌是二酮哌嗪類化合物典型的拮抗菌之一,對蠟狀芽孢桿菌具有顯著的抑菌作用;抗腫瘤抗生素的新制癌菌素和抑制RNA轉(zhuǎn)錄的遠(yuǎn)霉素等,可以確定該菌株具有較強的次級代謝潛力,為該菌株次級代謝產(chǎn)物的深度挖掘奠定了良好的理論基礎(chǔ)。目前,通過對菌株進行全基因組測序及生物信息學(xué)分析來解析菌株次級代謝已成為天然產(chǎn)物挖掘的新方向,在TRM68367基因組中含有與代謝相關(guān)的次級代謝產(chǎn)物合成相關(guān)基因,通過對GO、COG、KEGG功能注釋分析驗證發(fā)現(xiàn)其結(jié)果具有較高的準(zhǔn)確性。
本研究相關(guān)實驗結(jié)果為鏈霉菌新物種的鑒定提供參考數(shù)據(jù),同時豐富了物種資源庫;通過全基因組測序分析和代謝組分分析為天然產(chǎn)物的深度挖掘提供理論指導(dǎo)。