梅 瑜,徐世強(qiáng),顧 艷,孫銘陽,周 芳,李靜宇,張聞婷,王繼華
(廣東省農(nóng)業(yè)科學(xué)院作物研究所/廣東省農(nóng)作物遺傳改良重點(diǎn)實(shí)驗(yàn)室/廣東省道地南藥資源保護(hù)與利用工程中心,廣東 廣州 510640)
【研究意義】藥用植物遺傳資源是優(yōu)良品種選育的基礎(chǔ)。近年來隨著市場(chǎng)需求的增長(zhǎng),導(dǎo)致野生資源枯竭、馴化栽培品種品質(zhì)參差不齊。利用高通量測(cè)序技術(shù)能夠精準(zhǔn)評(píng)價(jià)藥用資源,解析其藥用活性的合成途徑和調(diào)控機(jī)制,有利于藥用資源的保護(hù)和利用。【前人研究進(jìn)展】艾蒿(Artemisia argyi),是菊科蒿屬植物,多年生草本或略呈半灌木狀,具濃烈香氣,全草入藥,有溫經(jīng)、祛濕、散寒、止血、安胎、通經(jīng)活絡(luò)等功效。艾蒿中的揮發(fā)油類[1]、黃酮類、萜類、生物堿類、多糖類[2]等天然化學(xué)產(chǎn)物和大量微量元素[3],具有鎮(zhèn)咳平喘、殺菌消炎、益氣活血、溫經(jīng)活絡(luò)、抗氧化等功效[4],艾灸具有增強(qiáng)免疫力和抗炎作用。其黃酮的主要成分包括甲基黃酮類、槲皮素和柚皮素等[5]。胡倩等[6]利用AB-8 型大孔樹脂分離純化了艾葉總黃酮提取物(TFEFAA),采用HPLC分析獲得TFEFAA 的主要成分為棕矢車菊素和異澤蘭黃素,雖然其質(zhì)量分?jǐn)?shù)分別只有0.6%和0.20%,但能顯著增加SOD 酶、GSHPx 酶活力,且降低MDA 含量,能有效清除自由基和提高機(jī)體抗氧化能力。艾蒿還可作為天然的殺蟲劑、植物染料和飼料添加劑。艾蒿藥用功能顯著、價(jià)格低廉,因此在醫(yī)藥、農(nóng)業(yè)、工業(yè)等領(lǐng)域被廣泛利用,也受到學(xué)者們青睞。艾蒿品種較多,分布較為廣泛,藥用歷史悠久。梅全喜[7]記載艾蒿20 多種,紅足蒿(紅腳艾)是其中之一。三元宮碑文記載,1600 年前葛洪、鮑菇夫婦在羅浮山用紅腳艾為當(dāng)?shù)匕傩罩尾?,因此羅浮山紅腳艾在嶺南地區(qū)較有代表性,又稱“紅艾”“鮑姑艾”,別名神艾,與北艾、蘄艾同屬于菊科蒿屬艾草種植物。嶺南紅腳艾為菊科紅足蒿(Artemisia rubripesNakai),生長(zhǎng)在陽光充足的田野,莖枝呈紫紅色,多有橫臥地下根狀莖伴匍匐生長(zhǎng),植株最高1 m 左右,香氣醇厚,基本為野生。紅腳艾常用于艾灸,是臨床應(yīng)用艾葉的來源之一。其蛋白質(zhì)中含有16 種常見氨基酸,7 種為必需氨基酸,必需氨基酸占總氨基酸的40.97%,功能性氨基酸占總氨基酸的53.6%,且葉小絨少,味略苦(其他品系艾草較苦)[8],因此廣東當(dāng)?shù)厝顺⒓t腳艾用作主要的食材原料之一。【本研究切入點(diǎn)】目前,艾蒿的研究多集中于化學(xué)成分的分離鑒定、提取工藝優(yōu)化,以及藥理作用研究,而紅腳艾相關(guān)研究較少,尤其對(duì)紅腳艾組學(xué)研究和次生代謝產(chǎn)物合成途徑解析及化合物合成關(guān)鍵基因鑒定等未見報(bào)道?!緮M解決的關(guān)鍵問題】由于紅腳艾基因組信息缺乏,本研究利用高通量測(cè)序平臺(tái)Illumina HiSeq 2500,選擇紅腳艾不同組織進(jìn)行混合DNA 池測(cè)序,通過Trinity 軟件de novo 組裝獲得紅腳艾轉(zhuǎn)錄組Unigene 庫,并基于公共數(shù)據(jù)庫對(duì)Unigene 進(jìn)行功能注釋,為后續(xù)的次生代謝產(chǎn)物合成途徑研究、相關(guān)功能基因挖掘及驗(yàn)證提供基礎(chǔ)數(shù)據(jù)。
供試材料紅腳艾蒿(A.rubripesNakai)種植于廣東省農(nóng)業(yè)科學(xué)院作物研究所南藥資源圃,由王繼華研究員鑒定。選擇長(zhǎng)勢(shì)基本一致的健康植株,采摘葉片,用錫箔紙包裹迅速置于液氮中。
紅腳艾總RNA 采用生工生物Total RNA Extractor kit(B511311-0025)進(jìn)行提取,用1%瓊脂糖電泳檢測(cè)總RNA 的完整性,用Qubit?2.0熒光計(jì)Life Tech(Invitrogen)對(duì)總RNA 進(jìn)行定量。
紅腳艾RNA 樣品檢測(cè)合格后進(jìn)行轉(zhuǎn)錄組測(cè)序。利用Illumina?NEBNext?UltraTMRNA Library Prep Kit 制備測(cè)序文庫,之后使用Agilent Bioanalyzer 2100 評(píng)估文庫質(zhì)量;構(gòu)建合格文庫后,利用Illumina Hiseq 2500 平臺(tái)進(jìn)行測(cè)序,獲得雙端測(cè)序數(shù)據(jù);過濾原始數(shù)據(jù)中的接頭、低質(zhì)量(reads≤35 nt)和ploy-N 堿基的序列,獲得clean data,計(jì)算GC、Q20、Q30 含量及序列重復(fù)水平;采用Trinity 軟件進(jìn)行de novo 拼接組裝,用RSeQC 軟件去除冗余序列獲得Unigene,并評(píng)估基因表達(dá)水平[9-10]。利用BLAST 軟件[11],基于NR、GO、COG、KOG、KEGG 等數(shù)據(jù)庫[12-18]對(duì)組裝的Unigene 進(jìn)行功能注釋。
使用MISA 微衛(wèi)星識(shí)別工具鑒定簡(jiǎn)單重復(fù)序列(Simple Sequence Repeat,SSR)并進(jìn)行分析。
利用Illumina Hiseq 2500 平臺(tái)對(duì)紅腳艾RNA樣品進(jìn)行轉(zhuǎn)錄組測(cè)序后,去掉含有接頭和低質(zhì)量的序列,共得到7.24 Gb clean data,24 126 043 條reads,GC 含量為44.67%,各樣品Q30 堿基百分比均不小于92.57%,說明文庫構(gòu)建質(zhì)量良好,試驗(yàn)數(shù)據(jù)可靠。經(jīng)de novo 組裝,共得到173 093個(gè)轉(zhuǎn)錄本,平均長(zhǎng)度為891.24 bp,N50 為1 406 bp,序列長(zhǎng)度大于500 bp 的有96 861 個(gè),占總序列數(shù)目的55.96%;轉(zhuǎn)錄本去冗余后得到85 991 個(gè)Unigene,平均長(zhǎng)度為616.87 bp,N50 為925 bp,其中30 533 個(gè)(35.51%)序列長(zhǎng)度大于500 bp,有14 408 個(gè)(16.75%)序列長(zhǎng)度在1 000 bp 以上(表1)。
表1 紅腳艾轉(zhuǎn)錄組測(cè)序結(jié)果統(tǒng)計(jì)Table 1 Statistics of transcriptome sequencing results of Artemisia rubripes Nakai
通過BLAST軟件將獲得的85 991個(gè)Unigene序列與不同功能數(shù)據(jù)庫進(jìn)行比對(duì),共注釋到47 216個(gè)(54.91%)Unigene(表2)。其中,NR數(shù)據(jù)庫(40 802個(gè),47.45%)、KOG數(shù)據(jù)庫(26 171個(gè),30.43%)、GO數(shù)據(jù)庫(23 203個(gè),26.98%)和KEGG數(shù)據(jù)庫(16 846個(gè),19.59%),COG數(shù)據(jù)庫注釋到的Unigene數(shù)量最少(12 810個(gè),14.9%)。
表2 Unigene 的功能注釋統(tǒng)計(jì)Table 2 Statistics of functional annotation of Unigene
2.2.1 NR 功能注釋 NR 數(shù)據(jù)庫注釋結(jié)果顯示,紅腳艾與向日葵(Helianthus annuus)的單基因匹配率(13 552 個(gè),15.76%)最高,其次是萵苣(Lactuca sativa,9 187 個(gè),10.68%)、洋薊(Cynara cardunculusvar.scolymus,6 609 個(gè),7.69%),與菊花(Chrysanthemum×morifolium)、莫氏黑粉菌(Moesziomyces antarcticusT-34)、青稞(Hordeum vulgaresubsp.Vulgare)的單基因匹配均小于400個(gè)??梢?,紅腳艾與菊目菊科物種的相似度高。
2.2.2 GO 功能注釋 GO 注釋結(jié)果(圖1)顯示,紅腳艾有23 203 個(gè)Unigene 被歸為生物過程(43 283 個(gè),50.33%)、細(xì)胞組成(47 818 個(gè),55.79%)和分子功能(27 375 個(gè),31.83%)三大類共51 個(gè)功能分類。在分子功能中,催化活性(12 156 個(gè),14.14%)和結(jié)合(11 434 個(gè),13.30%)注釋到的Unigene 較多;在細(xì)胞組分中,細(xì)胞(9 631 個(gè),11.20%)和細(xì)胞部分(9 607個(gè),11.17%)注釋到的Unigene 較多;生物過程中,代謝過程(11 847 個(gè),13.78%)和分子過程(10 948 個(gè),12.73%)注釋最豐富。
圖1 紅腳艾Unigene 的GO 功能分類Fig.1 Classification of GO function of Artemisia rubripes Nakai Unigene
2.2.3 KEGG代謝通路分析 從KEGG數(shù)據(jù)庫注釋結(jié)果來看,16 846 個(gè)Unigene 參與到130 條代謝途徑中。其中核糖體途徑注釋的基因較豐富(824 個(gè),4.89%),其次是碳代謝(604 個(gè),3.59%)、剪切體(503 個(gè),2.99%)、內(nèi)質(zhì)網(wǎng)中蛋白質(zhì)加工(474個(gè),2.81%)和氨基酸生物合成(466 個(gè),2.77%)等。參與類黃酮生物合成的基因有49 個(gè),僅占0.29%。萜類作為自然界中結(jié)構(gòu)多、種類多的天然化合物,其生物合成分為前體合成、骨架構(gòu)建和后修飾3 部分。本研究獲得萜類骨架合成過程Unigene 105 個(gè),參與直接前體GPP(Geranyl-PP)、IPP(Isopentenyl-PP)及DMAPP(Dimethylallyl-PP)的形成,參與單萜生物合成相關(guān)的Unigene 有13個(gè),參與二萜生物合成的Unigene 有27 個(gè),參與倍半萜和三萜生物合成相關(guān)的Unigene 有14 個(gè),萜類經(jīng)細(xì)胞色素P450 等酶修飾后形成化合物,如二萜類化合物對(duì)腫瘤有一定治療作用,二萜類激素Gas 對(duì)植物發(fā)育具有調(diào)控作用,三萜皂苷具有很高的藥用價(jià)值等。
2.2.4 KOG 功能分類 KOG 數(shù)據(jù)庫分析結(jié)果(圖2)顯示,紅腳艾26 171 個(gè)Unigene 被注釋到25個(gè)KOG 功能分類中。其中,一般功能預(yù)測(cè)的基因最多,共有5 458 個(gè),占20.86%;其次是信號(hào)傳導(dǎo)機(jī)制相關(guān)基因(2 976 個(gè),11.37%),翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶基因(2 862 個(gè),10.94%),翻譯、核糖體結(jié)構(gòu)與生物發(fā)生相關(guān)基因(1 690 個(gè),6.46%),轉(zhuǎn)錄相關(guān)基因(1 527 個(gè),5.83%),細(xì)胞內(nèi)運(yùn)輸、分泌和囊泡轉(zhuǎn)運(yùn)相關(guān)基因(1 374個(gè),5.25%),碳水化合物運(yùn)輸和代謝相關(guān)基因(1 319 個(gè),5.04%),與次生代謝物生物合成、運(yùn)輸和分解代謝相關(guān)基因(1 164 個(gè),4.45%)等,細(xì)胞運(yùn)動(dòng)注釋到的基因最少,僅18 個(gè),占0.07%;未知功能的基因有1 491 個(gè),需在后期挖掘其功能。
圖2 紅腳艾Unigene 的KOG 功能分類Fig.2 Classification of KOG function of Artemisia rubripes Nakai Unigene
2.2.5 COG 功能注釋 COG 數(shù)據(jù)庫功能注釋結(jié)果(圖3)形式,共有12 810 個(gè)Unigene 被注釋到25 個(gè)COG 功能分類中。其中,翻譯、核糖體結(jié)構(gòu)與生物發(fā)生的基因最多,有1 525 個(gè),占11.9%;其次是一般功能預(yù)測(cè)基因(1 515 個(gè),11.83%),翻譯后修飾、蛋白質(zhì)轉(zhuǎn)運(yùn)、伴侶基因(1 287 個(gè),10.05%),信號(hào)傳導(dǎo)機(jī)制相關(guān)基因(1 106 個(gè),8.63%),碳水化合物運(yùn)輸和代謝相關(guān)基因(1 098 個(gè),8.57%)等;注釋基因最少的是RNA 加工與修飾,僅13 個(gè),占0.1%;另有277 個(gè)Unigene 被注釋到未知功能基因,762 個(gè)Unigene 與次生代謝生物合成、運(yùn)輸和分解代謝相關(guān),占5.95%。
圖3 紅腳艾Unigene 的COG 功能分類Fig.3 Classification of COG function of Artemisia rubripes Nakai Unigene
利用MISA 軟件篩選得到10 00 bp 以上的紅腳艾Unigene 并進(jìn)行SSR 分析,結(jié)果(圖4)鑒定出6 種類型、3 529 個(gè)SSR 標(biāo)記。其中,單堿基重復(fù)SSR(p1)最多,共檢測(cè)到1 684 個(gè)位點(diǎn);其次是三堿基重復(fù)SSR(p3)共檢測(cè)到1 017 個(gè),雙堿基重復(fù)SSR(p2)有539 個(gè),復(fù)合型重復(fù)SSR(c)有232 個(gè),四堿基重復(fù)SSR(p4)有37個(gè),五堿基重復(fù)SSR(p5)和六堿基重復(fù)SSR(p6)較少,分別為5 個(gè)和11 個(gè)。
圖4 紅腳艾Unigene 的SSR 位點(diǎn)分析Fig.4 SSR sites analysis of Artemisia rubripes Nakai Unigene
紅腳艾歷史上主要分布于嶺南地區(qū),惠州市的博羅縣、羅浮山及廣州市番禺區(qū)等地皆有縣志及通史記載,但近代以來對(duì)其研究與利用很少。隨著本草組學(xué)技術(shù)的發(fā)展,許多藥用植物基因組得到解析,也使得很多資源得以利用和保護(hù)[19]。由于藥用植物基因組學(xué)研究晚于大眾作物,因此轉(zhuǎn)錄組學(xué)成了本草基因組學(xué)研究的重要手段之一。本研究借助高通量測(cè)序技術(shù)對(duì)紅腳艾轉(zhuǎn)錄組進(jìn)行了初步探究,共獲得7.24 Gb clean data,GC含量為44.67%,Q30堿基百分比達(dá)到92.57%以上;通過Trinity 進(jìn)行de novo 組裝,共得到173 093 個(gè)轉(zhuǎn)錄本,對(duì)組裝的轉(zhuǎn)錄本去冗余后共獲得85 991個(gè)Unigene,平均長(zhǎng)度為616.87 bp,N50 為925 bp,說明紅腳艾的組裝質(zhì)量較好,能夠滿足后續(xù)數(shù)據(jù)分析的要求。
通過數(shù)據(jù)庫比對(duì),注釋到47 216 個(gè)Unigene,與向日葵(H.annuus)、萵苣(L.sativa)、洋薊(C.cardunculusvar.scolymus)等菊科植物匹配基因最多,另有45.09%的Unigene 未被注釋,可能由于蒿屬植物組學(xué)報(bào)道較少或組裝的序列較短等原因?qū)е拢?0]。在KEGG 代謝通路分析中,核糖體途徑、蛋白質(zhì)加工、氨基酸生物合成途徑注釋的基因較豐富,可能與氨基酸種類、總氨基酸含量較高有關(guān),而參與類黃酮生物合成的基因有49 個(gè),僅占0.29%,這可能是紅腳艾側(cè)柏酮含量極低的原因。本研究結(jié)果可為紅腳艾功能基因挖掘、次級(jí)代謝物質(zhì)合成通路解析提供幫助,也可為中藥指紋圖譜構(gòu)建和種質(zhì)資源鑒定保存及分子輔助良種選育提供基礎(chǔ)[21]。
SSR 分子標(biāo)記具有豐度高、共顯性和多等位性等優(yōu)點(diǎn)[22],可利用現(xiàn)有的數(shù)據(jù)庫資源開發(fā)SSR 引物。本研究鑒定到紅腳艾SSR 位點(diǎn)3 529 個(gè),可為其分子標(biāo)記開發(fā)、遺傳多樣性分析、種質(zhì)資源鑒定與優(yōu)選、分子標(biāo)記育種等奠定理論基礎(chǔ),為利用分子手段鑒定、區(qū)分紅腳艾品種及評(píng)價(jià)其質(zhì)量提供依據(jù)。
本研究通過高通量測(cè)序技術(shù)獲得了紅腳艾的轉(zhuǎn)錄組信息特征,經(jīng)de novo 組裝共獲得85 991個(gè)Unigene,有47 216 個(gè)Unigene 在NR、KEGG、COG、KOG、GO 和Pfam 數(shù)據(jù)庫獲得功能注釋。KEGG 代謝通路中,有16 846 個(gè)Unigene 參與氨基酸、萜類、黃酮類等130 條代謝途徑,其中有466 個(gè)Unigene 參與氨基酸合成、49 個(gè)Unigene 參與黃酮類合成。同時(shí)在紅腳艾中還鑒定到3 529 個(gè)SSR 標(biāo)記,通過獲得的紅腳艾遺傳標(biāo)記位點(diǎn)分布和Unigene,可進(jìn)行SSR 引物設(shè)計(jì),為紅腳艾種質(zhì)資源遺傳改良、分子輔助育種奠定基礎(chǔ)。