周丁丁,范元嬋,王杰,蔣海賓,祝智威,范小雪,陳華枝,杜宇,周紫彧,熊翠玲,鄭燕珍,付中民,陳大福,郭睿
福建農(nóng)林大學(xué)動物科學(xué)學(xué)院(蜂學(xué)學(xué)院),福州 350002
【研究意義】蜜蜂球囊菌(Ascosphaera apis,簡稱球囊菌)是一種專性侵染蜜蜂幼蟲的真菌性病原[1],對西方蜜蜂(Apis mellifera)幼蟲、中華蜜蜂(Apis cerana cerana,簡稱中蜂)雄蜂和工蜂幼蟲以及成年熊蜂均具有侵染性[2-3]。球囊菌可導(dǎo)致蜜蜂幼蟲罹患白堊病,能夠引起成年蜜蜂數(shù)量和蜂群生產(chǎn)力大幅下降[2-5]。長鏈非編碼 RNA(long non-coding RNA,lncRNA)是一類主要由RNA聚合酶II轉(zhuǎn)錄,不具備蛋白編碼能力,缺少完整開放閱讀框(ORF)且長度>200 nt的轉(zhuǎn)錄本[6],已被證明在真核生物的基因組印記和細(xì)胞周期等諸多生物學(xué)過程中扮演關(guān)鍵角色[7-8]。然而,球囊菌的lncRNA研究十分滯后。本研究基于前期獲得的球囊菌菌絲和孢子混合樣品的高質(zhì)量lncRNA組學(xué)數(shù)據(jù)開展相關(guān)生物信息學(xué)分析和分子生物學(xué)驗證,對球囊菌lncRNA的順式(cis)作用、反義lncRNA(antisense lncRNA)作用和競爭性內(nèi)源RNA(competing endogenous RNA,ceRNA)作用進(jìn)行全面分析和深入探討。研究結(jié)果可豐富球囊菌的lncRNA信息,為其他真菌的lncRNA提供參考,并揭示lncRNA在球囊菌中的潛在調(diào)控功能?!厩叭搜芯窟M(jìn)展】LncRNA可通過順式作用調(diào)控同一染色體上鄰近蛋白編碼基因的表達(dá)[9];通過反式作用調(diào)控距離較遠(yuǎn)基因的轉(zhuǎn)錄激活及表達(dá)[9-10];含有微小 RNA反應(yīng)元件(microRNA response element,MRE)的lncRNA還能夠通過發(fā)揮 ceRNA作用吸附結(jié)合miRNA,從而間接調(diào)節(jié)下游靶mRNA的表達(dá)[11];還能與特定蛋白質(zhì)結(jié)合形成核酸蛋白復(fù)合物,調(diào)控蛋白活性或改變蛋白在細(xì)胞中的定位,以及作為某些小RNA的前體分子[12-13]。VAN WERVEN等[14]研究發(fā)現(xiàn)在釀酒酵母(Saccharomyces cerevisiae)的孢子形成過程中,lncRNAIRT1通過順式作用抑制轉(zhuǎn)錄因子Rme1與啟動子IME1的結(jié)合,從而抑制IME1的表達(dá);孢子形成過程中另一個lncRNAIME4-AS的表達(dá)能夠抑制IME4的表達(dá)。杜慶國[15]通過對正常磷水培和低磷水培2 d和8 d的地下和地上的玉米組織進(jìn)行鏈特異性建庫的RNA-seq測序,基于測序數(shù)據(jù)預(yù)測出65 099個lncRNA,進(jìn)一步利用psRobot軟件預(yù)測6 787個差異表達(dá)lncRNA(differentially expressed lncRNA,DElncRNA)可靶向結(jié)合miR399,推測這些DElncRNA通過影響miR399的表達(dá)介導(dǎo)玉米的低磷脅迫響應(yīng)。SHAO等[16]通過對生理鹽水和嗎啡耐受兩組小鼠的比較分析,鑒定到 136個 DElncRNA,進(jìn)而通過構(gòu)建和分析 DElncRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò)發(fā)現(xiàn)部分DElncRNA可作為潛在的ceRNA競爭性結(jié)合miRNA,從而間接影響泛素化途徑、GRCP和TLR信號通路。真菌lncRNA的研究起步較晚且進(jìn)展緩慢,有限的 lncRNA研究主要集中于芽殖酵母(Schizosaccharomyces cerevisiae)、裂殖酵母(Schizosaccharomyces pombe)和粗糙脈孢菌(Neurospora crassa)等少數(shù)真菌物種[14,17-19],昆蟲病原真菌的lncRNA研究未見報道。球囊菌的基因組序列信息早在2006年就已公布[20];但其完整的基因序列和功能注釋信息直到 2016年才正式公布[21]。因此,球囊菌的分子生物學(xué)及組學(xué)研究進(jìn)展緩慢。前期研究中,筆者團(tuán)隊組裝和注釋了球囊菌的參考轉(zhuǎn)錄組[22];分析和探討了侵染意大利蜜蜂(Apis mellifera ligustica,簡稱意蜂)幼蟲和中蜂幼蟲的球囊菌的轉(zhuǎn)錄組動態(tài)和致病機(jī)理[23-24];近期又利用PacBio單分子實時測序技術(shù)(SMRT)對實驗室條件下純培養(yǎng)的球囊菌進(jìn)行了測序,重新組裝和注釋了更高質(zhì)量的全長轉(zhuǎn)錄組,包含394 142條高可信度的全長轉(zhuǎn)錄本以及11 623條參考基因組未注釋的全長轉(zhuǎn)錄本[25],可為參考基因組的完善、新基因的全長克隆以及可變剪接和可變腺苷酸化的研究提供數(shù)據(jù)基礎(chǔ)?!颈狙芯壳腥朦c】筆者團(tuán)隊前期利用鏈特異性建庫的 lncRNA-seq技術(shù)分別對純化的球囊菌菌絲和孢子的混合樣品進(jìn)行了深度測序,對球囊菌lncRNA的數(shù)量、種類和保守性進(jìn)行了分析,并全面比較了lncRNA和mRNA的結(jié)構(gòu)特點[26]。但上述lncRNA在球囊菌中的作用方式及潛在調(diào)控功能尚不清楚?!緮M解決的關(guān)鍵問題】基于已獲得的高質(zhì)量 lncRNA組學(xué)數(shù)據(jù)對球囊菌 lncRNA的順式作用、反義lncRNA作用和ceRNA作用進(jìn)行深入細(xì)致的分析和探討,以期豐富球囊菌lncRNA的相關(guān)信息,并在組學(xué)水平揭示球囊菌lncRNA的潛在調(diào)控功能。
試驗于2019年在福建農(nóng)林大學(xué)動物科學(xué)學(xué)院(蜂學(xué)學(xué)院)蜜蜂保護(hù)實驗室完成。
球囊菌菌株由福建農(nóng)林大學(xué)動物科學(xué)學(xué)院(蜂學(xué)學(xué)院)蜜蜂保護(hù)實驗室分離、培養(yǎng)和保存[22-24]。
筆者團(tuán)隊前期已利用鏈特異性建庫的 lncRNA-seq技術(shù)對球囊菌菌絲和孢子混合樣品進(jìn)行測序,共獲得了70 612 299條原始讀段(raw reads),質(zhì)控后共獲得48 268 696條有效讀段(clean reads),平均Q30達(dá)到90.21%,測序數(shù)據(jù)質(zhì)量良好[26];利用軟件CNCI、CPC、Pfam和CAPT分別預(yù)測出578、1 848、1 460和 1 662條 lncRNA,四者的交集為 379條lncRNA,即高可信度的球囊菌lncRNA[26]。高質(zhì)量的lncRNA組學(xué)數(shù)據(jù)可用于本研究中l(wèi)ncRNA順式作用、反義lncRNA作用和ceRNA作用的生物信息學(xué)分析。原始數(shù)據(jù)已上傳NCBI SRA數(shù)據(jù)庫,BioProject號:PRJNA395108。
筆者團(tuán)隊前期已利用small RNA-seq(sRNA-seq)技術(shù)對球囊菌菌絲和孢子的混合樣品進(jìn)行測序,獲得了70 612 299條raw reads,質(zhì)控后得到48 268 696條clean reads,平均Q30達(dá)到98.75%[27]。高質(zhì)量的sRNA組學(xué)數(shù)據(jù)為本研究中l(wèi)ncRNA與miRNA以及miRNA和mRNA靶向結(jié)合關(guān)系的預(yù)測提供數(shù)據(jù)支撐。原始數(shù)據(jù)已上傳NCBI SRA 數(shù)據(jù)庫,BioProject號:PRJNA560456。
LncRNA位于編碼蛋白基因上下游,可能與啟動子、增強子和可誘導(dǎo)元件等產(chǎn)生部分重疊,在轉(zhuǎn)錄或轉(zhuǎn)錄后水平對其鄰近蛋白編碼基因的表達(dá)具有調(diào)控作用[8-9]。參照周丁丁等[28]的方法,將lncRNA上下游100 kb范圍內(nèi)的鄰近基因作為其調(diào)控的靶基因,利用Blast軟件(采用默認(rèn)參數(shù))將lncRNA的上下游基因比對到GO數(shù)據(jù)庫(http://geneontology.org/)和KEGG數(shù)據(jù)庫(https://www.kegg.jp/),獲得上下游基因的功能和通路注釋。
LncRNA序列可以與對應(yīng)的靶mRNA序列堿基互補配對,在配對的過程中,可以攜帶某些作用因子到靶mRNA,進(jìn)而調(diào)控相關(guān)編碼蛋白基因的表達(dá)[11]。參照周丁丁等[28]的方法,利用 LncTar軟件[29]對lncRNA的靶 mRNA進(jìn)行預(yù)測,基于 lncRNA和mRNA之間的互補序列,計算配對位點自由能和標(biāo)準(zhǔn)化自由能,標(biāo)準(zhǔn)化自由能閾值以下的則認(rèn)為是lncRNA的靶mRNA。利用Blast軟件(采用默認(rèn)參數(shù))將lncRNA的互補序列基因比對到eggNOG數(shù)據(jù)庫(http://eggnogdb.embl.de/)和KEGG數(shù)據(jù)庫,獲得相應(yīng)的蛋白功能注釋信息。
參照郭睿等[30]的方法,利用Target Finder軟件[31]預(yù)測球囊菌lncRNA靶向結(jié)合的miRNA以及miRNA靶向結(jié)合的mRNA,利用三者之間的靶向結(jié)合關(guān)系構(gòu)建lncRNA-miRNA及l(fā)ncRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò),并通過Cytoscape v 3.7.1軟件[28,31]對上述調(diào)控網(wǎng)絡(luò)進(jìn)行可視化。
根據(jù)1.6中靶向預(yù)測的結(jié)果,隨機(jī)選取9個調(diào)控網(wǎng)絡(luò)中的lncRNA(MSTRG.6443.1、MSTRG.2135.1、MSTRG.2134.1、MSTRG.3422.1、MSTRG.2302.1、MSTRG.5023.1、MSTRG.5584.1、MSTRG.1870.1 和MSTRG.1614.1)和8個靶mRNA(gene2674、gene4126、gene4125、gene1602、gene5384、gene1986、gene989、和gene1970)進(jìn)行RT-PCR驗證。根據(jù)上述lncRNA和mRNA的核酸序列,利用Primer Primer 5.0軟件設(shè)計相應(yīng)的特異性引物,委托上海生工生物工程有限公司合成引物(表 1)。選取actin(gene6001)作為 lncRNA和mRNA的內(nèi)參基因(陽性對照)。將9對lncRNA(或8對mRNA)特異性上游引物(1 μL/種)和下游引物(1 μL/種)混合,以無菌水為模板進(jìn)行RT-PCR,作為陰性對照。利用RNA抽提試劑盒(TaKaRa公司,日本)分別提取球囊菌菌絲的總 RNA和孢子的總RNA,將1 μg菌絲RNA與1 μg孢子RNA等量混合,作為模板進(jìn)行反轉(zhuǎn)錄,得到的 cDNA作為模板進(jìn)行PCR。PCR反應(yīng)體系(20 μL):cDNA模板1 μL,上游引物 1 μL,下游引物 1 μL,Mixture 10 μL,無菌水7 μL。PCR程序:95℃預(yù)變性 5 min;95℃變性 30 s,55℃退火30 s,72℃延伸30 s,共34個循環(huán);72℃再延伸5 min。PCR產(chǎn)物經(jīng)1.5%瓊脂糖凝膠電泳和凝膠成像儀(上海培清,中國)檢測。
根據(jù)1.6中靶向預(yù)測的結(jié)果,隨機(jī)選取7個調(diào)控網(wǎng)絡(luò)中的靶miRNA(miR-281-y、miR-13-y、miR-11980-y、miR-6057-y、miR-1-z、miR-9-z 和miR-13-x)參照郭睿等[27]和杜宇等[32]的方法,利用DNAMAN軟件(Lynnon Biosoft 公司,美國)設(shè)計miRNA的Stem-loop引物、特異性上游引物和通用下游引物,委托上海生工生物工程有限公司合成引物(表1)。選取actin(gene6001)作為miRNA的內(nèi)參基因(陽性對照)。將7對miRNA特異性上游引物(1 μL/種)和通用下游引物(1 μL/種)混合,以無菌水為模板進(jìn)行RT-PCR,作為陰性對照。利用RNA抽提試劑盒(TaKaRa公司,日本)分別提取球囊菌菌絲的總RNA和孢子的總RNA,將1 μg菌絲RNA與1 μg孢子RNA等量混合作為反轉(zhuǎn)錄的模板。利用Stem-loop引物反轉(zhuǎn)錄得到 cDNA,作為模板進(jìn)行 PCR擴(kuò)增。PCR 體系(20 μL):上下游引物(1.67 mol·L-1)各 1 μL,cDNA 模板 1 μL,PCR mix 10 μL,無菌水 7 μL。PCR程序:95℃預(yù)變性5 min;95℃變性30 s,梯度退火30 s,72℃延伸30 s,共34個循環(huán);72℃再延伸5 min。PCR產(chǎn)物經(jīng)1.5%瓊脂糖凝膠電泳和凝膠成像儀(上海培清,中國)檢測。
球囊菌的371個lncRNA共預(yù)測出5 852個上下游基因。GO數(shù)據(jù)庫注釋結(jié)果顯示,這些上下游基因可注釋到48個功能條目,涉及生物學(xué)進(jìn)程、分子功能和細(xì)胞組分 3大類;其中生物學(xué)進(jìn)程相關(guān)的前 5個條目分別是細(xì)胞進(jìn)程(1 707)、代謝進(jìn)程(1 705)、單組織進(jìn)程(1 231)、定位(473)和生物學(xué)調(diào)控(325);細(xì)胞組分相關(guān)的前5個條目分別是細(xì)胞(1 163)、細(xì)胞組件(1 163)、細(xì)胞器(795)、細(xì)胞膜(532)和大分子復(fù)合物(501);分子功能相關(guān)的前5個條目分別是催化活性(1 796)、結(jié)合(1 388)、轉(zhuǎn)運活性(180)、分子結(jié)構(gòu)活性(106)和核酸結(jié)合轉(zhuǎn)化因素(40)(圖1)。括號內(nèi)的數(shù)字表示注釋到該條目的上下游基因數(shù)。
KEGG數(shù)據(jù)庫注釋結(jié)果顯示,這些上下游基因可注釋到121條通路,注釋基因數(shù)最多的前10位分別為新陳代謝途徑(564)、次生代謝產(chǎn)物的生物合成(233)、抗生素的生物合成(176)、氨基酸的生物合成(89)、碳代謝(81)、核糖體(78)、嘌呤代謝(75)、剪接體(66)、RNA轉(zhuǎn)運(65)和細(xì)胞周期-酵母(62)。括號內(nèi)的數(shù)字表示注釋到該通路的上下游基因數(shù)。
表1 本研究使用的引物Table 1 Primers used in this study
共預(yù)測出球囊菌的7個lncRNA與7個mRNA序列互補,它們的結(jié)合關(guān)系如圖2所示。其中,有1個靶mRNA(gene3444)在KEGG數(shù)據(jù)庫注釋為核孔復(fù)合體蛋白An-Nup120和假定蛋白(K14303),另有1個靶mRNA(gene1554)注釋為假定蛋白(K07117);共有 5個靶基因(gene1316、gene1194、gene4650、gene5233和gene1554)在eggNOG數(shù)據(jù)庫中注釋為假定蛋白(表2)。
共預(yù)測出227個lncRNA靶向結(jié)合73個miRNA,二者之間形成較為復(fù)雜的調(diào)控網(wǎng)絡(luò),其中MSTRG.2597.1、MSTRG.4497.1和MSTRG.1789.9靶向結(jié)合的miRNA數(shù)量較多,分別為7、7和6個;但多數(shù) lncRNA(79.02%)僅能結(jié)合 1—2個 miRNA;部分 miRNA可靶向多個 lncRNA,其中 miR-34-x、miR-10-x和miR-375-y結(jié)合的lncRNA數(shù)量最多,分別為31、27和24個(圖3);但多數(shù)miRNA(80.82%)可靶向的lncRNA數(shù)少于10個。
表2 球囊菌中與lncRNA序列互補靶標(biāo)的功能注釋Table 2 Functional annotation of complementary targets with lncRNA sequence in A. apis
根據(jù)lncRNA與miRNA、miRNA與mRNA的靶向結(jié)合關(guān)系構(gòu)建 lncRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò),發(fā)現(xiàn)三者之間具有更為復(fù)雜的調(diào)控關(guān)系,227個lncRNA靶向73個miRNA,這些miRNA可結(jié)合50個靶mRNA。對上述靶mRNA進(jìn)行KEGG數(shù)據(jù)庫注釋,結(jié)果顯示它們共注釋到28條通路,注釋最多的通路是新陳代謝途徑(9),其次為次生代謝產(chǎn)物的生物合成(4)、自噬-其他真核生物(3)、線粒體自噬-酵母(3)和自噬-酵母(3)(表3)。進(jìn)一步分析發(fā)現(xiàn)有10個靶mRNA可注釋到9條物質(zhì)能量代謝通路,分別為谷胱甘肽代謝(2)、脂肪酸延長(1)、不飽和脂肪酸的生物合成(1)、鞘脂類代謝(1)、脂肪酸代謝(1)、碳代謝(1)、氧化磷酸化(1)、丙酸代謝(1)、糖酵解和糖質(zhì)生(1)。括號內(nèi)的數(shù)字代表注釋在該通路的靶mRNA數(shù)。
根據(jù)靶mRNA對應(yīng)的Nr數(shù)據(jù)庫蛋白注釋信息,篩選與氧化磷酸化通路和 MAPK信號通路相關(guān)的靶mRNA及與上述靶 mRNA存在靶向結(jié)合關(guān)系的miRNA及相應(yīng)lncRNA,分析發(fā)現(xiàn)氧化磷酸化通路相關(guān)調(diào)控網(wǎng)絡(luò)包含222個lncRNA、78個靶miRNA和50個靶mRNA,其中MSTRG.2597.1、MSTRG.4497.1及MSTRG.1789.9結(jié)合的miRNA數(shù)最多,分別為7、7和6個(圖4-A);MAPK信號通路相關(guān)調(diào)控網(wǎng)絡(luò)包含222個lncRNA、76個靶miRNA和46個靶mRNA,其中MSTRG.4497.1、MSTRG.2597.1及MSTRG.1789.9結(jié)合的miRNA數(shù)最多,分別為7、7和6個(圖4-B);共有217個lncRNA和66個miRNA同時涉及上述兩條通路的調(diào)控網(wǎng)絡(luò)。
為驗證ceRNA網(wǎng)絡(luò)中 lncRNA、靶miRNA和靶mRNA的表達(dá),通過RT-PCR對上述ceRNA網(wǎng)絡(luò)中l(wèi)ncRNA和靶mRNA的進(jìn)行擴(kuò)增,擴(kuò)增產(chǎn)物的電泳結(jié)果顯示9個lncRNA均能擴(kuò)增出預(yù)期大小的目的條帶,陽性對照能擴(kuò)增出目的片段而陰性對照未擴(kuò)增出片段;8個靶mRNA能擴(kuò)增出預(yù)期片段,陽性對照能擴(kuò)增出目的片段而陰性對照未擴(kuò)增出片段;上述結(jié)果證實了lncRNA和靶mRNA的真實表達(dá)。利用Stem-loop RT-PCR對7個miRNA進(jìn)行檢測,電泳結(jié)果顯示它們均能擴(kuò)增出預(yù)期大小的目的片段,陽性對照能擴(kuò)增出目的片段而陰性對照未擴(kuò)增出片段(圖5),證實了miRNA的真實表達(dá)。上述結(jié)果表明球囊菌中l(wèi)ncRNA、靶miRNA和靶mRNA真實表達(dá)。
表3 球囊菌ceRNA網(wǎng)絡(luò)中靶mRNA注釋數(shù)前12位的KEGG通路Table 3 Top 12 KEGG pathways annotated by target mRNAs involved in A. apis ceRNA networks
球囊菌侵染蜜蜂幼蟲導(dǎo)致白堊病,該病危害蜜蜂健康并長期困擾養(yǎng)蜂生產(chǎn)。相對于酵母等模式真菌,球囊菌的分子生物學(xué)及組學(xué)研究較為滯后,miRNA和lncRNA等ncRNA的相關(guān)研究更為匱乏。目前,較多的研究表明 lncRNA在人類、黑腹果蠅(Drosophila melanogaster)、秀麗隱桿線蟲(Caenorhabditis elegans)、擬南芥(Arabidopsis thaliana)和酵母(Saccharomyces)等模式生物中發(fā)揮特殊而重要的調(diào)控功能[8,10-14,33-35]。筆者團(tuán)隊前期已對球囊菌的miRNA進(jìn)行了全基因組鑒定、分析和驗證[27];并對侵染中華蜜蜂6日齡幼蟲的球囊菌的miRNA差異表達(dá)譜及調(diào)控網(wǎng)絡(luò)進(jìn)行了解析[36]。近期,為最大限度鑒定球囊菌的 lncRNA,筆者團(tuán)隊利用鏈特異性建庫的 lncRNA-seq技術(shù)對球囊菌菌絲和孢子混合樣品進(jìn)行了深度測序,通過生物信息學(xué)方法對lncRNA的數(shù)量、種類、結(jié)構(gòu)特征進(jìn)行了初步分析,鑒定到379個lncRNA,包括242個反義lncRNA、123個基因間區(qū)lncRNA(lincRNA)、13個正義鏈 lncRNA(sense lncRNA)和 1個內(nèi)含子 lncRNA(intronic transcript lncRNA)[26];并對部分lncRNA的真實表達(dá)進(jìn)行了分子驗證[26];此為球囊菌lncRNA的首次研究報道?;谝勋@得的高質(zhì)量lncRNA組學(xué)數(shù)據(jù),本研究進(jìn)一步探究球囊菌lncRNA的順式作用、反義lncRNA作用和ceRNA作用,發(fā)現(xiàn)lncRNA在球囊菌的物質(zhì)和能量代謝、遺傳信息傳遞、環(huán)境刺激應(yīng)答、信號通路、細(xì)胞生長和細(xì)胞周期等生物學(xué)過程中具有潛在的調(diào)控功能。
LncRNA發(fā)揮順式作用主要是通過影響同一染色體上的鄰近蛋白編碼基因的表達(dá)發(fā)揮調(diào)控功能[9]。CAI等[37]利用RNAi技術(shù)和細(xì)胞實驗對7周齡的興化雌雞各組織和器官進(jìn)行研究,發(fā)現(xiàn)位于Six1基因上游432 bp處的lncRNA-Six1可編碼一個約7.26 kD的小肽,進(jìn)而通過順式作用影響Six1的表達(dá)以促進(jìn)雞肉細(xì)胞增殖及誘導(dǎo)細(xì)胞分裂。FENG等[38]利用lncRNA-seq技術(shù)對長牡蠣(Crassostrea gigas)的白色、黑色、金色和正常外殼進(jìn)行深度測序,預(yù)測出1 157個lncRNA及潛在調(diào)控的24 057個上下游基因,進(jìn)一步分析結(jié)果顯示427個DElncRNA可靶向2 088個上下游基因,這些上下游基因涉及RNA甲基轉(zhuǎn)移酶和tRNA甲基轉(zhuǎn)移酶活性,以及ECM-受體相互作用、Jak-STAT信號通路和Notch信號通路,作者推測相關(guān)DElncRNA通過順式作用調(diào)節(jié)牡蠣殼的色素沉淀。本研究中,371個lncRNA共預(yù)測出5 852個上下游基因,其中分別有1 705、64、31和61個上下游基因注釋到代謝進(jìn)程、發(fā)育進(jìn)程、生長和繁殖。還發(fā)現(xiàn)分別有1 163、1 163和795個上下游基因注釋到細(xì)胞、細(xì)胞組件和細(xì)胞器,表明lncRNA可能通過順式作用調(diào)節(jié)球囊菌的細(xì)胞生命活動。
碳代謝在真菌生長和發(fā)育中扮演關(guān)鍵角色,其中一碳代謝在機(jī)體代謝活動發(fā)揮重要作用;而中心碳代謝是生物體所需能量的主要來源,并為其他代謝提供前體反應(yīng)物,糖酵解途徑和磷酸戊糖途徑都屬于中心碳代謝[39]。WANG等[40]利用轉(zhuǎn)錄組測序技術(shù)和分子生物學(xué)手段對野生型和突變型的谷氨酸棒桿菌(Corynebacterium glutamicum)進(jìn)行深入分析,通過13C代謝通量分析,發(fā)現(xiàn)兩個轉(zhuǎn)錄因子gntR1-E70K和ramA-A52V可促進(jìn)突變型谷氨酸棒桿菌的糖酵解和磷酸戊糖途徑相關(guān)基因上調(diào)表達(dá),說明這兩個轉(zhuǎn)錄因子加快了谷氨酸棒桿菌的中心碳代謝。本研究中,分別有81、39和21個上下游基因注釋到碳代謝、糖酵解/糖異生途徑和磷酸戊糖途徑,表明相應(yīng)的 lncRNA可能通過順式作用調(diào)控球囊菌的一碳代謝和中心碳代謝。此外,分別有57、21和11個上下游基因注釋到氧化磷酸化、甲烷代謝和硫代謝等能量代謝途徑,說明相應(yīng)的lncRNA可能通過順式作用調(diào)控上述能量代謝通路。
生物體能夠以糖類、氨基酸和核苷酸等初級代謝產(chǎn)物為前體,合成一些對于生長發(fā)育不可或缺的次級代謝產(chǎn)物,例如苯丙素類、萜類和黃酮類化合物[41-42]。本研究中,分別有30、27、20、16、13、12和7個上下游基因涉及氨基糖和核苷糖代謝、纈氨酸和亮氨酸及異亮氨酸的降解、果糖和甘露糖代謝、煙酸和煙酰胺代謝、賴氨酸降解、鞘脂類代謝和維生素B6代謝,表明相應(yīng)的lncRNA通過調(diào)控上述初級代謝產(chǎn)物的加工,合成必要的次級代謝產(chǎn)物供球囊菌的生長和發(fā)育;此外,分別有233、15、7、4、1和1個lncRNA上下游基因涉及次級代謝物生物合成、萜類化合物生物合成、泛醌和其他烯萜類生物合成、酮體的合成與降解、碳青霉烯類生物合成和倍半萜三萜類生物合成,再次說明相關(guān)lncRNA通過調(diào)控次級代謝產(chǎn)物的合成與降解參與對球囊菌生長和發(fā)育的調(diào)節(jié)。HUARTE-BONNET等[43]利用含烷烴培養(yǎng)基培養(yǎng)球孢白僵菌(Beauveria bassiana),發(fā)現(xiàn)過氧化物酶體生物合成途徑相關(guān)的Bbhyd1和Bbhyd2兩個基因被激活,在過氧化物酶活性高的菌絲團(tuán)形成菌絲球過程中,球孢白僵菌表現(xiàn)出過氧化物酶體增多和表面明顯增厚的現(xiàn)象。本研究中,有32個上下游基因注釋到過氧化物酶體,說明相關(guān)lncRNA(MSTRG.4299.3、MSTRG.6298.3和MSTRG.6220.4等)對該通路具有潛在的順式調(diào)控作用。
應(yīng)激反應(yīng)是生物體對外界刺激的一種適應(yīng)性機(jī)制,真菌在面對營養(yǎng)物質(zhì)缺乏、溫度脅迫、物理化學(xué)因子刺激和機(jī)械損傷時可在一定環(huán)境壓力范圍內(nèi)通過自身應(yīng)激調(diào)節(jié)來適應(yīng)和生存[44]。金屬伴侶蛋白是一類胞內(nèi)可溶性金屬結(jié)合蛋白,可以將金屬離子準(zhǔn)確地交付給目標(biāo)蛋白,促使機(jī)體激活金屬酶,同時也保證細(xì)胞免受金屬危害[45]。本研究發(fā)現(xiàn),分別有1 796、247、106、19、3和3個上下游基因涉及催化活性、應(yīng)激反應(yīng)、結(jié)構(gòu)性分子活性、信號傳感器活性、分子傳感器活性和金屬伴侶蛋白活性,說明相應(yīng)的lncRNA可能通過順式作用參與調(diào)控球囊菌的環(huán)境適應(yīng)及細(xì)胞內(nèi)的生化反應(yīng),以及保護(hù)細(xì)胞抵御外界不良因素的影響。
有些 lncRNA能夠與一些距離較遠(yuǎn)的基因序列互補配對,也可以攜帶某些調(diào)控因子到互補的靶mRNA上,通過影響基因的表達(dá)發(fā)揮調(diào)控功能[9,28]。CHACKO等[46]基于Northern blot、單分子熒光原位雜交和RNA-seq等技術(shù)對新型隱球酵母(Cryptococcus neoformans)進(jìn)行深入研究,發(fā)現(xiàn)lncRNARZE1影響新型隱球酵母的關(guān)鍵基因ZNF2的轉(zhuǎn)錄,RZE1可以調(diào)控新型隱球酵母菌絲的形成。本研究預(yù)測到 7個lncRNA(MSTRG.3576.1、MSTRG.2795.1、MSTRG.1238.1、MSTRG.5393.1、MSTRG.1387.1、MSTRG.1672.1和 MSTRG.3829.1)與7個靶 mRNA(gene1316、gene548、gene1194、gene3444、gene4650、gene5233和gene1554)之間存在序列互補;分析發(fā)現(xiàn)其中5個靶mRNA對應(yīng)的蛋白在eggNOG數(shù)據(jù)庫中注釋為假定蛋白(表 2),說明球囊菌的基因注釋信息尚不完善,基因組質(zhì)量偏低和分子生物學(xué)研究滯后是主要原因。僅有g(shù)ene3444對應(yīng)的蛋白注釋為核孔復(fù)合體蛋白(表2),表明相應(yīng)的lncRNA(MSTRG.5393.1)通過與相應(yīng) mRNA序列互補調(diào)控球囊菌核孔復(fù)合體蛋白的合成,可能會影響核苷酸、酶和轉(zhuǎn)錄因子進(jìn)出細(xì)胞核,以及遺傳信息的傳遞。然而,本研究并未發(fā)現(xiàn)可以作為miRNA前體的lncRNA。鑒于本研究的組學(xué)數(shù)據(jù)來源于實驗室條件下的球囊菌純培養(yǎng),而lncRNA的表達(dá)具有細(xì)胞、組織、發(fā)育階段和脅迫時期特異性[47],因此對于球囊菌 lncRNA是否能通過作為miRNA前體發(fā)揮更為廣泛而靈活的調(diào)控作用,仍需要進(jìn)一步研究。下一步將利用鏈特異性建庫的lncRNA-seq技術(shù)對球囊菌侵染的不同日齡蜜蜂幼蟲腸道進(jìn)行測序,通過連續(xù)比對核糖體數(shù)據(jù)庫、宿主基因組和球囊菌基因組篩濾得到純凈的病原lncRNA數(shù)據(jù),進(jìn)而開展處于侵染過程的球囊菌的lncRNA調(diào)控作用研究。
ceRNA假說認(rèn)為,具有 MRE的不同種類 RNA如lncRNA、circRNA和假基因等,可通過競爭性結(jié)合miRNA間接調(diào)節(jié)基因表達(dá)[48]。目前,該假說已被越來越多的研究證實。周丁丁等[28]研究發(fā)現(xiàn)東方蜜蜂微孢子蟲(Nosema ceranae)的lncRNA通過ceRNA作用調(diào)控孢子中的物質(zhì)和能量代謝等基本生命活動。筆者團(tuán)隊前期系統(tǒng)分析和探討了意蜂工蜂中腸發(fā)育過程的lncRNA差異表達(dá)譜及調(diào)控網(wǎng)絡(luò)[30]、意蜂工蜂中腸響應(yīng)東方蜜蜂微孢子蟲脅迫的lncRNA差異表達(dá)譜及調(diào)控網(wǎng)絡(luò)[49],發(fā)現(xiàn)相關(guān)DElncRNA可能通過ceRNA作用參與意蜂工蜂中腸、意蜂幼蟲腸道的發(fā)育及真菌病原脅迫應(yīng)答過程。氧化磷酸化是提供真菌生命活動所需能量的基礎(chǔ)代謝途徑[50]。MAPK信號通路在酵母等真菌的信號轉(zhuǎn)導(dǎo)、生長發(fā)育、脅迫應(yīng)答和致病性等方面起到關(guān)鍵作用[51]。本研究中,球囊菌的 227個lncRNA與92個miRNA及96個mRNA之間形成的調(diào)控網(wǎng)絡(luò)十分復(fù)雜,因此針對氧化磷酸化通路和MAPK信號通路相關(guān)的 lncRNA、靶 miRNA和靶mRNA構(gòu)建調(diào)控網(wǎng)絡(luò),分析發(fā)現(xiàn) MSTRG.2597.1、MSTRG.4497.1和MSTRG.1789.9等球囊菌lncRNA靶向結(jié)合 miRNA數(shù)量較多;共有 217個 lncRNA(MSTRG.1135.4、MSTRG.2904.2和 MSTRG.5757.1等)同時參與上述兩個通路的調(diào)控;表明相關(guān)的球囊菌lncRNA可能作為ceRNA間接調(diào)節(jié)靶mRNA的表達(dá)。進(jìn)一步分析發(fā)現(xiàn),調(diào)控網(wǎng)絡(luò)中的靶mRNA可注釋到碳代謝和脂肪酸代謝等18條物質(zhì)能量代謝通路,以及細(xì)胞周期和減數(shù)分裂。上述結(jié)果說明相應(yīng)的球囊菌lncRNA可能通過ceRNA作用對物質(zhì)和能量代謝以及生殖進(jìn)行調(diào)控。本研究中,MSTRG.3576.1、MSTRG.1238.1和MSTRG.3829.1同時參與了順式作用、反義lncRNA作用和ceRNA作用,說明這3個lncRNA作為多功能的調(diào)控因子,可通過多種方式對球囊菌的生物學(xué)過程進(jìn)行靈活調(diào)控。
球囊菌的371個lncRNA通過順式作用潛在調(diào)控5 852個上下游基因的表達(dá),227個lncRNA可通過92個 miRNA間接調(diào)控 96個靶 mRNA的表達(dá),部分lncRNA可能通過順式作用和ceRNA作用調(diào)節(jié)球囊菌的生長發(fā)育及物質(zhì)能量代謝;球囊菌的7個 lncRNA可作為反義RNA調(diào)控7個互補配對的mRNA的表達(dá),MSTRG.5393.1潛在參與調(diào)控球囊菌的核孔復(fù)合體的蛋白合成。