葉碧歡, 楊 陽, 朱杰麗, 石從廣,陳友吾, 胡傳久, 宋其巖, 李海波*
(1. 浙江省林業(yè)科學(xué)研究院,浙江 杭州 310023;2. 浙江農(nóng)林大學(xué) 林業(yè)與生物技術(shù)學(xué)院,浙江 杭州 311300)
黃精屬 Polygonatum Mill. 隸屬百合科(Liliaceae),為多年生草本植物,在世界范圍內(nèi)廣泛分布。 該屬植物在我國(guó)有31 種,除南方熱帶以外,南北方各有分布[1]。 在黃精屬植物的化學(xué)成分和藥理活性研究方面,多集中于甾體皂苷和多糖二種主要活性成分[2-3],對(duì)黃酮類化合物的報(bào)道較少且不深入,大多為總黃酮提取工藝、含量測(cè)定以及生物活性評(píng)價(jià)[4-6]。 通過比較《中國(guó)藥典》記載的3 種黃精新鮮塊莖的總黃酮質(zhì)量分?jǐn)?shù)顯示, 黃精P. sibiricum Red.、滇黃精P. kingianum Coll. et Hemsl.和多花黃精P. cyrtonema Hua. 的總黃酮質(zhì)量分?jǐn)?shù)均比較低,分別為0.018~0.035、0.015~0.030、0.004~0.034 mg/g,且在不同黃精屬種間以及不同產(chǎn)地間存在很大差異[7]。
黃酮類化合物是一類廣泛分布于植物體內(nèi)的次生代謝物,目前已從黃精屬8 種植物中共分離出6 種(高異黃酮類、異黃酮類、黃酮類、查耳酮類、二氫黃酮類、紫檀烷類)不同結(jié)構(gòu)亞型的化合物54 個(gè)[8],其中高異黃酮類(Homoisoflavones)最多,是該屬植物的特征性成分,在自然界頗為少見,有降血糖、抗炎、抗氧化、抗腫瘤、抗衰老等藥理活性,具有重要的研究?jī)r(jià)值[9-10]。因此,研究黃精屬植物中黃酮類,特別是高異黃酮類化合物的生物合成途徑與調(diào)控機(jī)制, 可為黃酮類化合物的合成生物學(xué)研究奠定基礎(chǔ),也為通過外源誘導(dǎo)手段促進(jìn)黃酮類物質(zhì)的大量積累,以及今后黃酮類藥物和保健品的產(chǎn)業(yè)化研發(fā)開辟新的來源途徑。
近年來,轉(zhuǎn)錄組測(cè)序技術(shù)已廣泛用于藥用植物新基因的發(fā)現(xiàn)、分子標(biāo)記挖掘、代謝途徑的確定等研究,有助于次生代謝相關(guān)基因的挖掘與功能研究[11-16]。迄今,黃精屬植物的轉(zhuǎn)錄組學(xué)研究多在黃精和滇黃精2 個(gè)物種上開展,且以多糖和甾體皂苷為主[17-21],在多花黃精物種上僅有多糖合成相關(guān)基因的報(bào)道[20],有關(guān)黃精屬植物黃酮類化合物生物合成途徑的分析與相關(guān)基因鑒定尚屬空白。
作者將對(duì)多花黃精組培苗不同發(fā)育期的根莖進(jìn)行比較轉(zhuǎn)錄組學(xué)研究,擬基于轉(zhuǎn)錄組數(shù)據(jù)的組裝與注釋,鑒定與黃酮類化合物生物合成相關(guān)的關(guān)鍵基因,并對(duì)在多花黃精幼苗期根莖中表達(dá)的轉(zhuǎn)錄因子(Transcription factor,TF)進(jìn)行鑒定與分類?;谵D(zhuǎn)錄組FPKM 數(shù)據(jù)篩選塊莖不同發(fā)育期的差異表達(dá)基因, 分析差異表達(dá)基因在次生代謝通路的富集,比較黃酮類化合物生物合成關(guān)鍵基因在不同發(fā)育期塊莖中的差異表達(dá), 并進(jìn)行實(shí)時(shí)熒光定量PCR(RT-qPCR)驗(yàn)證。 本研究可彌補(bǔ)黃精屬植物黃酮類化合物生物合成途徑基因資源的空白,為后續(xù)研究黃酮類化合物合成與積累的分子調(diào)控機(jī)制奠定基礎(chǔ)。
以多花黃精種子作為外植體,經(jīng)消毒處理后無菌誘導(dǎo)其植株再生,建立組培快繁體系。 組培培養(yǎng)基為1/2 MS(Murashige & Skoog)。 培養(yǎng)條件為溫度25 ℃,濕度50%,光照2500200 lx。 以培養(yǎng)于浙江省林業(yè)科學(xué)研究院林木育種組培實(shí)驗(yàn)室的多花黃精Polygonatum cyrtonema 組培苗為試材。 從組培瓶中取出分別培養(yǎng)了3 個(gè)月和9 個(gè)月的多花黃精幼苗,切去莖葉,取帶芽根莖立即用液氮速凍,存儲(chǔ)于-80 ℃作為轉(zhuǎn)錄組學(xué)研究用材料。 兩種材料均取6 瓶, 其中3 瓶以去除須根后的塊莖作為總黃酮質(zhì)量分?jǐn)?shù)分析的3 個(gè)生物學(xué)重復(fù),另3 瓶作為轉(zhuǎn)錄組測(cè)序的3 個(gè)生物學(xué)重復(fù)。
多花黃精塊莖總黃酮的測(cè)定參考文獻(xiàn)[22]的方法,以蘆丁作為對(duì)照品,利用紫外分光光度計(jì)測(cè)定各樣品510 nm 處的吸光度(A510nm)。 以蘆丁質(zhì)量濃度為橫坐標(biāo),吸光度為縱坐標(biāo),繪制出標(biāo)準(zhǔn)曲線,得到回歸方程。 多花黃精塊莖總黃酮的提取參考文獻(xiàn)[23]的方法并略微修改,即稱取完全干燥粉碎的塊莖10 g,加入甲醇500 mL,于40 ℃下超聲提取1 h,過濾,取濾液60 mL,加入100 mL 酸解液(75 mL 甲醇+25 mL 鹽酸),水浴回流酸解100 min,加甲醇定容,過濾,取濾液檢測(cè)A510nm。 根據(jù)蘆丁標(biāo)準(zhǔn)曲線和回歸方程,計(jì)算不同樣品的總黃酮質(zhì)量分?jǐn)?shù)。
式中:I 為總黃酮質(zhì)量分?jǐn)?shù),mg/g;C 為樣品提取液的總黃酮質(zhì)量濃度,mg/mL;N 稀釋倍數(shù);V 為定容體積,mL;m 為多花黃精塊莖樣品質(zhì)量,g。
轉(zhuǎn)錄組測(cè)序與序列組裝和功能注釋的具體方法參考作者所在課題組前期研究報(bào)告[24],簡(jiǎn)述為:采用Plant Total RNA Miniprep Purification Kit(TR02,GeneMark,Taiwan,China) 提取多花黃精根莖的總RNA。 采用SureSelect Strand-Specific RNA Library Prep for Illumina Multiplexed Sequencing (Agilent Technologies,G9691)構(gòu)建測(cè)序文庫;使用Trinity 軟件(v2012-10-15)對(duì)測(cè)序得到的高質(zhì)量clean reads從頭組裝, 再利用CAP3 (r12/21/07) 軟件拼接為unigene; 將unigene 序 列 比 對(duì) 到Nr、SwissProt、KEGG、COG/KOG 和Pfam 蛋白數(shù)據(jù)庫以及擬南芥基因組數(shù)據(jù)庫TAIR10(E-value≤1×10-5),得到與給定unigene 具有最高序列相似的蛋白質(zhì), 獲得蛋白質(zhì)功能注釋信息。
利 用Blast 程 序(https://www.ncbi.nlm.nih.gov/)將unigene 序列與Nr 蛋白數(shù)據(jù)庫中的轉(zhuǎn)錄因子信息進(jìn)行相似性比對(duì)(閾值:E-value≤1×10-5),得到與給定unigene 具有最高序列相似性的TF, 獲得TF注釋信息。
采 用 Cuffdiff (v 2.1.1) 軟 件 計(jì) 算 FPKM(Fragments per kilobase of transcript per million fragments mapped)值[25]作為衡量轉(zhuǎn)錄本表達(dá)水平的指標(biāo),使用錯(cuò)誤發(fā)現(xiàn)率FDR(False discovery rate)進(jìn)行可信度檢驗(yàn)。 差異表達(dá)基因的篩選標(biāo)準(zhǔn)為:倍數(shù)差異(Fold change,F(xiàn)C)≥2,F(xiàn)DR<0.01。 根據(jù)基因在不同樣品中的表達(dá)量進(jìn)行差異表達(dá)分析與功能富集分析, 差異表達(dá)基因的KEGG 富集分析采用KOBAS(v 2. 0)軟件。 基于KEGG 注釋的代謝途徑統(tǒng)計(jì)與次生代謝相關(guān)的unigene 數(shù)量, 基于Nr 和TAIR10 注釋信息統(tǒng)計(jì)與黃酮生物合成相關(guān)的unigene 數(shù)量。根據(jù)注釋結(jié)果鑒定參與黃酮類化合物生物合成途徑的unigene 及其編碼的代謝酶。
取上述1.3 中用于轉(zhuǎn)錄組測(cè)序的RNA 樣品進(jìn)行RT-qPCR 分析。 以RNA 為模板使用Prime ScriptTMRT reagent Kit with gDNA Eraser Kit(Perfect Real Time)逆轉(zhuǎn)錄合成cDNA 第一鏈,逆轉(zhuǎn)錄方法參照試劑盒說明。 用于RT-qPCR 分析的內(nèi)參基因?yàn)閁BQ-E2-10 和EF-1α2。 擴(kuò)增目的基因和內(nèi)參基因的引物序列見2.1 部分。 使用Oligo 7.57 軟件設(shè)計(jì)特異性引物,引物合成由杭州有康生物科技有限公司完成。
RT-qPCR 分析參考作者所在課題組前期研究報(bào)告[26],具體為:反應(yīng)在LineGene 9600 Plus 上進(jìn)行。 反應(yīng)體系為(10 μL):cDNA 模板1 μL,上、下游引 物 均 為0.2 μL,2×SYBR Green Mix (BioEasy Master Mix)5 μL,ddH2O 3.6 μL。 擴(kuò)增程序?yàn)椋汉銣囟?5 ℃2 min;循環(huán)段95 ℃15 s,60 ℃20 s,40 個(gè)循環(huán);溶解段95 ℃15 s,60 ℃1 min,95 ℃15 s。 每個(gè)實(shí)驗(yàn)設(shè)3 個(gè)技術(shù)重復(fù)。
采用2-△△Ct法[27]計(jì)算RT-qPCR 實(shí)驗(yàn)中的基因相對(duì)表達(dá)量。
基于Illumina HiSeq 2500 測(cè)序平臺(tái)獲得多花黃精3 個(gè)月和9 個(gè)月幼苗期根莖的轉(zhuǎn)錄組數(shù)據(jù)。 經(jīng)對(duì)原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì), 去除raw data 中的接頭序列及低質(zhì)量reads,共獲得約12 GB 的高質(zhì)量clean data。通過對(duì)2 個(gè)時(shí)期轉(zhuǎn)錄本數(shù)據(jù)的合并組裝,經(jīng)拼接后共得到73218 條unigenes 序列(≥300 bp),其中長(zhǎng)度在1 kb 以上的有17249 條。 所有unigenes 序列與各大數(shù)據(jù)庫進(jìn)行注釋比對(duì), 結(jié)果顯示, 共有35 511 條unigenes 獲得基因注釋信息, 占全部unigenes 的48.5%, 其中長(zhǎng)度大于1 kb 以上的有16640 條(見表1)。
表1 數(shù)據(jù)庫注釋的unigene 數(shù)量Table 1 Annotated unigene numbers in databases
根據(jù)對(duì)2 個(gè)不同發(fā)育期根莖樣品在各大數(shù)據(jù)庫的整體注釋,共鑒定出與黃酮類化合物生物合成相關(guān)的unigenes 83 條,編碼18 個(gè)代謝酶(見表2)。目前,異黃酮類化合物(Isoflavones)的生物合成途徑比較明確, 涉及的關(guān)鍵酶包括PAL、CHS、CHI 和異黃酮合成酶(IFS)[28-31]。 本研究在鑒定出的83 個(gè)酶基因中包括了PAL、CHS、CHI、F3H、FLS、DFR、F3′,5′H 等一批黃酮類化合物生物合成的關(guān)鍵性酶基因,但I(xiàn)FS 酶基因沒有得到注釋,這可能是由于在培養(yǎng)了3~9 個(gè)月的多花黃精幼苗期,其根莖中IFS 基因尚未充分表達(dá),也可能與unigenes 的組裝拼接質(zhì)量有關(guān)。
表2 多花黃精轉(zhuǎn)錄組黃酮類化合物合成途徑中的酶基因Table 2 Genes involved in the synthetic pathway of flavonoids in P. cyrtonema transcriptome
轉(zhuǎn)錄因子是在轉(zhuǎn)錄水平上調(diào)控結(jié)構(gòu)基因表達(dá)的關(guān)鍵因素之一,在調(diào)節(jié)植物生長(zhǎng)發(fā)育、活性成分合成和環(huán)境脅迫中的基因表達(dá)發(fā)揮了主要作用。 許多轉(zhuǎn)錄因子家族由不同的基因家族組成, 包括bHLH、ERF、MYB-relaed、C2H2、NAC(NAM,ATAF1/2,CUC1/2)等。轉(zhuǎn)錄組數(shù)據(jù)顯示,在多花黃精幼苗期的根莖中,共有1359 個(gè)編碼轉(zhuǎn)錄因子的基因表達(dá),可以分類為56 個(gè)TF 家族(見圖1),以bHLH 類型最豐富(94 個(gè),占比6.92%),其次是ERF(82 個(gè),占比6.03%),MYB-relaed(79 個(gè),占比5.81%)、C2H2(67個(gè),占比4.93%)和NAC(58 個(gè),占比4.27%)。MYBrelaed 和bHLH 轉(zhuǎn)錄因子單獨(dú)或協(xié)作調(diào)節(jié)類黃酮次生代謝生物合成途徑中結(jié)構(gòu)基因的表達(dá),從而控制植物體內(nèi)類黃酮的生物合成[32]。 利用bHLH 轉(zhuǎn)錄因子調(diào)節(jié)藥用植物活性物質(zhì)生物合成的研究備受關(guān)注,其對(duì)黃酮類物質(zhì)(花青素等)、生物堿(尼古丁等)、 萜類等活性成分生物合成的調(diào)控作用已被證實(shí)[33]。 本研究中鑒定的轉(zhuǎn)錄因子為今后研究多花黃精活性成分(多糖、皂苷和黃酮類化合物等)的積累與外源調(diào)控機(jī)制提供了豐富的基礎(chǔ)數(shù)據(jù)。
圖1 多花黃精轉(zhuǎn)錄組中轉(zhuǎn)錄因子的分布Fig. 1 Distribution of transcription factors in P.cyrtonema transcriptome
篩選多花黃精2 個(gè)不同發(fā)育期根莖樣品間表達(dá)水平顯著差異的基因,形成差異基因數(shù)據(jù)庫。 通過分析差異基因數(shù)據(jù)庫共獲得2602 個(gè)差異基因,占總被注釋unigene 的7.33%,其中上調(diào)基因1866個(gè),下調(diào)基因736 個(gè)(見圖2)。這些差異表達(dá)基因?yàn)楹罄m(xù)開展次生代謝通路分析提供了基礎(chǔ)數(shù)據(jù)。
圖2 多花黃精不同發(fā)育期塊莖的差異表達(dá)基因Fig. 2 Differentially expressed genes in P. cyrtonema rhizome at different development stages
為了進(jìn)一步了解2 個(gè)不同發(fā)育期根莖樣品間差異表達(dá)基因參與的代謝通路,對(duì)這些差異表達(dá)基因進(jìn)一步利用KOBAS 進(jìn)行KEGG 富集分析, 發(fā)現(xiàn)有497 條unigenes 注釋到了109 個(gè)代謝通路中,且主要富集在代謝組(Metabolism)和遺傳信息處理組(Genetic information processing)。 其中富集的前20條通路統(tǒng)計(jì)如圖3 所示。
圖3 差異表達(dá)基因的KEGG 注釋分類Fig. 3 KEGG classification for differentially expressed genes in P. cyrtonema rhizome
在497 條unigenes 富 集 的109 個(gè)KEGG 代 謝通路中, 其中186 條定位到了19 個(gè)次生代謝物生物合成通路中,數(shù)量最多的是參與次生代謝物合成(Biosynthesis of secondary metabolites)通路,共118條,最少的是咖啡堿代謝(Caffeine metabolism)、吲哚類生物堿合成(Indole alkaloid biosynthesis)、黃酮和黃酮醇類合成(Flavone and flavonol biosynthesis)和硫代葡萄糖苷合成(Glucosinolate biosynthesis)通路,都僅只有1 條(見表3)。 此外,這些差異表達(dá)的酶基因也參與了像二苯乙烯類(Stilbenoids)、苯丙素(Phenylpropanoids)、萜 類(Terpenoids)、托 品 烷 類(Tropanes)、類胡蘿卜素(Carotenoids)、油菜素甾醇(Brassinosteroids)、 黃 酮 類 (Flavonoids) 和 甾 體(Steroids)等次生代謝物的合成。
表3 與多花黃精次生代謝相關(guān)的unigenesTable 3 Unigenes related to secondary metabolism of P. cyrtonema
對(duì)多花黃精組培苗在3 個(gè)月和9 個(gè)月發(fā)育期塊莖的總黃酮質(zhì)量分?jǐn)?shù)分析顯示,3 個(gè)月發(fā)育期塊莖中總黃酮的平均質(zhì)量分?jǐn)?shù)為0.008 mg/g,9 個(gè)月為0.012 mg/g,表明隨著根莖的不斷發(fā)育,其總黃酮質(zhì)量分?jǐn)?shù)也在不斷積累。 基于FPKM 值比較在3 個(gè)月和9 個(gè)月發(fā)育期塊莖的黃酮類化合物合成途徑中關(guān)鍵酶基因的表達(dá)水平, 發(fā)現(xiàn)9 個(gè)基因顯著上調(diào), 分別是PAL、4CL、DFR、ANS、FLS、UGT、F3′H、COMT 和F3′,5′MT 基因, 上調(diào)倍數(shù)為1.9~11.2;3個(gè)基因顯著下調(diào), 分別是CHS、CHI 和F3′,5′H 基因, 下調(diào)倍數(shù)為0.3~0.5;6 個(gè)基因的表達(dá)無明顯表達(dá)差異, 分別是CYP73A、F3H、LAR、CCOMT、HCT和C3′H 基因,這些基因的表達(dá)變化倍數(shù)為0.9~1.3(見表4)。 這表明隨著塊莖中總黃酮質(zhì)量分?jǐn)?shù)的不斷積累,其黃酮類化合物合成途徑中基因的差異表達(dá)并不一致,這也預(yù)示了多花黃精復(fù)雜的黃酮類化合物合成機(jī)制。
表4 黃酮類化合物合成途徑中的基因表達(dá)差異Table 4 Different gene expression involved in flavonoids biosynthesis
為驗(yàn)證18 個(gè)黃酮類化合物合成酶基因在不同發(fā)育期根莖中基于FPKM 值表達(dá)變化的可靠性,選取其中的7 個(gè)酶基因進(jìn)一步進(jìn)行RT-qPCR 分析,并繪制標(biāo)準(zhǔn)曲線。 結(jié)果顯示,所有酶基因和內(nèi)參基因(UBQ-E2-10 和EF-1α2)標(biāo)準(zhǔn)曲線的相關(guān)系數(shù)(R2)均≥0.97,擴(kuò)增效率均在90%~110%(見表5),表明所有RT-qPCR 引物的擴(kuò)增具有高特異性, 且擴(kuò)增效率一致,滿足利用2-△△Ct法進(jìn)行相對(duì)定量分析?;虮磉_(dá)結(jié)果顯示(見圖4),這7 個(gè)酶基因在不同發(fā)育期根莖中的差異表達(dá)與轉(zhuǎn)錄組FPKM 結(jié)果基本吻合,只是這兩種分析結(jié)果的差異表達(dá)倍數(shù)略有不同。
表5 用于RT-qPCR 分析的多花黃精黃酮類化合物生物合成相關(guān)酶基因Table 5 Genes involved in flavonoid biosynthesis in P. cyrtonema used for RT-qPCR analysis
圖4 多花黃精7 個(gè)黃酮類化合物生物合成相關(guān)酶基因的表達(dá)Fig. 4 Expression of 7 genes involved in flavonoid biosynthesis in P. cyrtonema
利用二代高通量測(cè)序技術(shù),對(duì)黃精屬原生藥材多花黃精幼苗期根莖進(jìn)行轉(zhuǎn)錄組測(cè)序,經(jīng)組裝拼接共產(chǎn)生了73218 條unigenes 序列, 其中35511 條被注釋;共鑒定出83 條unigenes 序列,分別編碼18個(gè)參與黃酮類化合物生物合成的關(guān)鍵酶;在幼苗期根莖中表達(dá)的1359 個(gè)轉(zhuǎn)錄因子中, 以bHLH 最為豐富,其次是ERF、MYB-relaed、C2H2 和NAC?;贔PKM 表達(dá)分析顯示, 隨著多花黃精塊莖中黃酮化合物的不斷積累,其黃酮類化合物合成途徑中基因的表達(dá)并不一致,18 個(gè)酶基因中的9 個(gè)顯著上調(diào),3個(gè)顯著下調(diào),6 個(gè)無明顯表達(dá)差異。與前期報(bào)道的藥用植物黃酮類化合物轉(zhuǎn)錄組學(xué)研究[34-38]相比,本研究鑒定出的黃酮類化合物合成酶的基因數(shù)量和種類有些許不同,例如細(xì)胞色素CYP450 基因、異黃酮合成酶(IFS)基因等,這可能是由于藥用植物在幼苗期根莖發(fā)育過程中黃酮類化合物生物合成相關(guān)酶基因的表達(dá)與葉、花、莖等器官中的表達(dá)水平不同而致,也可能與多花黃精的物種特異性有關(guān),這也預(yù)示了不同物種間黃酮類化合物的生物合成機(jī)理存在一定差異,百合科的黃精屬植物可能具有更為復(fù)雜的黃酮類化合物生物合成機(jī)制。 本研究為后續(xù)解析黃精屬植物黃酮類活性成分的合成、積累與外源調(diào)控機(jī)制奠定了基礎(chǔ)。