劉 暢,俸婷婷,,劉雄偉,丁晶鑫,石 慧,潘 婕,周 英,*
1.貴州中醫(yī)藥大學(xué)藥學(xué)院,藥食兩用資源應(yīng)用與開發(fā)研究中心,中藥材開發(fā)技術(shù)研究中心,貴州 貴陽 550025
2.貴州省藥食同源植物資源開發(fā)工程技術(shù)研究中心,貴州 貴陽 550025
八爪金龍Ardisia crispa(Thunb.) A.DC.是紫金??谱辖鹋僦参铮幱貌课粸楦?,別名朱砂根、百兩金、八爪龍、八爪根、鐵雨傘、高八爪、開喉箭等,該藥材在貴州分布廣、蘊藏量大,被苗族奉為喉科良藥;具有清熱解毒、散瘀止痛、祛風(fēng)除濕之功效,用于治療咽喉腫痛、扁桃體炎、心胃氣痛、勞傷吐血、跌撲損傷、風(fēng)濕骨痛[1]。現(xiàn)代藥理表明八爪金龍具有鎮(zhèn)痛、抗炎、抗癌、抗關(guān)節(jié)炎、抗白血病[2-5]等作用,是苗藥驗方開喉劍噴霧劑的主要成分[6]。
八爪金龍含有三萜苷類、黃酮類、異香豆素、葉綠素、揮發(fā)油、三萜類、酚類、醌類、強心苷、有機酸、鞣質(zhì)、氨基酸、糖類等多種化學(xué)成分[7-10]。其中香豆素類的巖白菜素為其主要有效成分,黃酮類物質(zhì),如漢黃芩素、千層紙素、漢黃芩素、黃芩苷[11]與巖白菜素協(xié)同起到止咳化痰的作用。隨著研究的深入,發(fā)現(xiàn)三萜苷或苷元類化合物是其主要化學(xué)成分和活性成分,目前已經(jīng)從八爪金龍中分離得到28 個三萜皂苷或皂苷元類成分[12-14]。但目前對八爪金龍的研究主要集中在化學(xué)成分[15]、藥理活性[16-17]、分子鑒別[18]等方面,而對八爪金龍次生代謝成分分子生物合成相關(guān)基因發(fā)掘和利用卻鮮有報道。
轉(zhuǎn)錄組高通量測序技術(shù)逐漸成為研究藥用植物天然活性成分生物合成相關(guān)功能基因挖掘及其表達規(guī)律的重要手段,如青蒿Artemisia carvifoliaBuch.-Ham.ex Roxb.Hort.Beng.[19]、西洋參Panax quiquefoliumL.[20]、人參Panax ginsengC.A.Meyer[21]、金銀花Lonicera japonicaThunb.[22]等均已經(jīng)完成了轉(zhuǎn)錄組測序分析,積累了一批與藥用次生代謝產(chǎn)物合成調(diào)控相關(guān)的基因。八爪金龍作為一種民族藥,具有重要的應(yīng)用價值,但其功能基因研究基礎(chǔ)十分薄弱。因此,本研究利用Illumina Hiseq 測序平臺對八爪金龍根進行轉(zhuǎn)錄組測序,以期獲得與其有效成分合成相關(guān)的基因信息,為進一步挖掘與克隆八爪金龍新的功能基因奠定基礎(chǔ)。
苗藥八爪金龍根部樣品采于貴陽花溪區(qū),經(jīng)貴州中醫(yī)藥大學(xué)魏升華教授鑒定為苗藥八爪金龍A.crispa(Thunb.) A.DC.。取八爪金龍根部用錫箔紙包裹并標記好后放置于液氮中冷凍,凍存于?80 ℃冰箱備用,用于后續(xù) RNA的提取。
將樣品在冰上融化后粉碎,充分混勻并離心,取適量上清,用Trizol 試劑分離提取總RNA,用Oligotex mRNA 試劑盒對RNA 進行純化。利用Aglient 2100 檢測RNA 樣品的濃度和完整性,12 個苗藥八爪金龍RNA 樣品均滿足轉(zhuǎn)錄組測序的建庫要求。滿足建庫要求的RNA 樣品送至北京百邁克生物科技有限公司,使用Illumina HiSeq 4000 平臺進行轉(zhuǎn)錄組測序。
對轉(zhuǎn)錄組測序得到原始測序數(shù)據(jù)(raw reads)后進行數(shù)據(jù)過濾,去除掉低質(zhì)量、包含接頭和未知堿基N 含量過高的reads,得到高質(zhì)量測序數(shù)據(jù)(clean reads)。利用Trinity 軟件[23]對clean reads進行重頭組裝,用cd-hit 軟件去除完全一樣的序列,然后使用tgicl 進行聚類,合并相似度大于90%,overlap 長度大于35 的序列,最后得到Unigenes。
使用BLAST[24]軟件將Unigenes序列與非冗余蛋白序列(NCBI non-redundant protein sequences,NR)、注釋和修訂蛋白序列數(shù)據(jù)庫(a manually annotated and reviewed protein sequence database,Swiss-Prot)、基因本體論(gene ontology,GO)、直系同源蛋白簇(clusters of orthologous groups,COG)、真核同源群簇(clusters of euKaryotic orthologous groups,KOG)、京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)[25-31]數(shù)據(jù)庫比對;使用KOBAS3.0[32]得到Unigenes在KEGG中的KEGG Orthology 結(jié)果;預(yù)測完Unigenes 的氨基酸序列之后使用HMMER 軟件[33]與Pfam(protein family)[34]數(shù)據(jù)庫比對,獲得Unigenes 的注釋信息。
采用Li 等[35]將測序得到的reads 與Unigenes庫進行比對,根據(jù)比對結(jié)果,結(jié)合RSEM(RNA-Seq by Expectation Maximization)[36]進行表達量水平估計。利用FPKM(fragments per kilobase of transcript per million mapped reads)[37]值表示對應(yīng)Unigenes的表達豐度。FPKM 是每百萬reads 中來自比對到某一基因每千堿基長度的reads 數(shù)目,是轉(zhuǎn)錄組測序數(shù)據(jù)分析中常用的基因表達水平估算方法。FPKM 能消除基因長度和測序量差異對計算基因表達的影響。
利用鑒定單重復(fù)序列的軟件 MISA(microsatellite identification tool)對轉(zhuǎn)錄組數(shù)據(jù)中的Unigenes 進行SSR 位點的檢測。按照單堿基、雙堿基、三堿基重復(fù)分別至少12、6、5 次,四堿基、五堿基、六堿基都不少于4 次的標準進行檢索分析。最后對獲得的SSR 數(shù)據(jù)進行分類統(tǒng)計分析。
利用Illumina HiSeq 4000 測序平臺對12 個苗藥八爪金龍根部樣品進行轉(zhuǎn)錄組測序,共獲得89.73 Gb 高質(zhì)量的clean reads,其Q30平均值達到95.05%,平均每個樣品的GC 含量占總堿基數(shù)的45.78%(表1)。利用Trinity 對clean reads 進行序列組裝,共獲得52 249條Unigenes,總長度為75 282 082 nt,平均長度為1440 nt,N50為2336 nt,組裝完整性較高。長度分布在300~500 nt 的Unigenes 最多,有15 065 條,占Unigenes 總數(shù)的28.83%;長度大于1000 nt 的Unigenes 有25 190條;長度大于2000 nt 的Unigenes 有13 283 條,占Unigenes 總數(shù)的25.42%。
表1 樣品測序數(shù)據(jù)統(tǒng)計Table 1 Transcriptome data output quality
對52 249 條Unigenes 進行COG、GO、KEGG、KOG、Pfam、SwissProt、eggNOG、NR 8 大數(shù)據(jù)庫比對。結(jié)果表明共有31 391 條Unigenes 被注釋到數(shù)據(jù)庫中,占全部Unigenes 的60.07%;其中NR數(shù)據(jù)庫中注釋到的Unigenes 最多,有31 179 條,占總Unigenes 的59.67%;其次是eggNOG 數(shù)據(jù)庫,注釋到29 953 條Unigenes(57.32%);COG、GO、KEGG、KOG、Pfam 和SwissProt 數(shù)據(jù)庫,分別注釋到10 988(21.03%)、19 195(36.73%)、12 775(24.45%)、18 741(35.86%)、22 793(43.62%)和22 173(42.43%)條Unigenes。Unigenes 注釋同源基因的物種分布如圖1所示,在相似序列匹配度較高的物種中,葡萄Vitis viniferaL.所占比例最高,3717 條;其次為栓皮櫟Quercus suberBl.(1334 條)、油橄欖Olea europaeaL.(1002 條)、咖啡CoffeacanephoraL.(960 條)、核桃Juglans regiaL.(928條)、芝麻Sesamum indicumL.(902 條)、胡蘿卜Daucus carotaLinn.var.sativaHoffm.(640 條)、橡膠樹Hevea brasiliensis(Willd.ex A.Juss.) Muell.Arg.(634 條)、可可Theobroma cacaoL.(631 條)、荷花Nelumbo nuciferaGaertn.(546 條),其他匹配物種的Unigenes 為19 848 條。
圖1 八爪金龍轉(zhuǎn)錄組Unigenes 與NR 數(shù)據(jù)庫匹配物種分布Fig.1 Species distribution of A.crispa transcriptome Unigenes against NR database
對苗藥八爪金龍轉(zhuǎn)錄組數(shù)據(jù)進行KOG 數(shù)據(jù)庫功能注釋和分類,共有18 741 條Unigenes 被注釋到25 種KOG 分類中,有4339 條Unigenes 被注釋到“一般功能預(yù)測(general function prediction only)”,是注釋最多Unigenes 的類群,占總數(shù)的23.15%;其次是“翻譯后修飾,蛋白質(zhì)周轉(zhuǎn),伴侶(posttranslational modification,protein turnover,chaperones)”2197 條,“信號轉(zhuǎn)導(dǎo)機制(signal transductionmechanisms)”1632 條,“翻譯,核糖體結(jié)構(gòu)和生物發(fā)生(translation,ribosomal structure and biogenesis)”1252 條。注釋到“碳水化合物運輸和代謝(carbohydrate transport and metabolism)”類群的Unigenes 有1075 條,803 條Unigenes 注釋到“脂質(zhì)轉(zhuǎn)運與代謝(lipid transport and metabolism)”,729條Unigenes 注釋到“氨基酸轉(zhuǎn)運與代謝(amino acid transport and metabolism)”,546 條Unigenes 注釋到“無機離子轉(zhuǎn)運與代謝(inorganic ion transport and metabolism)”,681 條Unigenes 注釋到“次生代謝物的生物合成、運輸和分解代謝(secondary metabolites biosynthesis,transport and catabolism)”(圖2)。
利用GO 數(shù)據(jù)庫對Unigenes 進行功能注釋,19 195條Unigenes 被注釋到細胞組成(cellular component),分子功能(molecular function)和生物過程(biological processes)3 大類。在細胞組成中Unigenes 主要聚集在細胞(cell)和細胞部分(cell part)2 個類群,分別注釋了8902 和8875 條;分子功能中聚集最多的2 個類群是催化活性(catalytic activity)和結(jié)合蛋白(binding),分別注釋到9627和8961 條Unigenes;在生物過程中聚集最多的2個類群是代謝過程(metabolic process)和細胞過程(cellular process),分別注釋了10 006 和9388 條Unigenes(圖3)。
通過KEGG 數(shù)據(jù)庫對八爪金龍Unigenes 進行注釋,共注釋到128 個KEGG 標準代謝通路。按照基因注釋量大小依次排序,選取前20 個代謝通路(表2),主要注釋到代謝通路(metabolic pathways)、次生代謝生物合成(biosynthesis of secondary metabolites)、核糖體(ribosome)、碳代謝(carbonmetabolism)、氨基酸生物合成(biosynthesis of amino acids)、內(nèi)質(zhì)網(wǎng)蛋白加工(protein processing in endoplasmic reticulum)、剪接體(spliceosome)、RNA 轉(zhuǎn)運(RNA transport)、植物激素信號轉(zhuǎn)導(dǎo)(plant hormone signal transduction)等通路。
圖2 八爪金龍轉(zhuǎn)錄組的KOG 功能分類Fig.2 KOG functional classifications of A.crispa transcriptome
圖3 八爪金龍轉(zhuǎn)錄組的GO 功能分類Fig.3 GO functional classifications of A.crispa transcriptome
表2 八爪金龍轉(zhuǎn)錄組Unigenes KEGG 通路分析統(tǒng)計Table 2 KEGG functional classifications of A.crispa transcriptome
KEGG 通路分析發(fā)現(xiàn)Unigenes 參與苯丙素、萜類、黃酮類、類胡蘿卜素、玉米素、生物堿等生物合成相關(guān)的18 個次生代謝通路(表3)。苯丙素的生物合成代謝通路(ko00940)Unigenes 數(shù)量最多,為126 條;萜類化合物骨架生物合成(ko00900)Unigenes 數(shù)量次之,為73 條;與黃酮類化合物生物合成(ko00941)有關(guān)的Unigenes 有58 條;其他萜類化合物生物合成(ko00130)的Unigenes 數(shù)量有52 條;類胡蘿卜素生物合成(ko00906)相關(guān)的Unigenes 數(shù)量有51 條;分別有30、30、28、20、18、14、12、6、6 條Unigenes 參與玉米素生物合成(ko00908),莨菪烷類、哌啶、吡啶生物堿生物合成(ko00960),異喹啉類生物堿生物合成(ko00950),倍半萜和三萜類化合物生物合成(ko00909),核黃素代謝(ko00740),二萜類生物合成(ko00904),油菜素內(nèi)酯生物合成(ko00905),單萜類生物合成(ko00902)以及黃酮和黃酮醇生物合成(ko00944)。咖啡因代謝(ko00232)、檸檬烯和蒎烯降解(ko00903)、芥子油苷生物合成(ko00966)和花青素生物合成(ko00942)通路基因數(shù)量較少。
表3 八爪金龍轉(zhuǎn)錄組Unigenes 次生代謝KEGG 通路注釋Table 3 Biosynthetic pathway of secondary metabolites involved in major active substances of A.crispa
2.5.1 香豆素生物合成相關(guān)基因的挖掘 苗藥八爪金龍中與香豆素生物合成相關(guān)的代謝通路為苯丙素的生物合成代謝通路(圖4)。莽草酸通過苯丙氨酸和酪氨酸等芳香氨基酸,經(jīng)脫氨、羥基化等一系列反應(yīng)形成,其中涉及多種酶的參與,苯丙氨酸解氨酶(phenylalanine ammonia-lyase,PAL)、肉桂-4-羥化酶(cinnamate 4-hydroxylase,C4H)和 4-香豆酸-輔酶-A(4-coumarate-CoA ligase,4CL)是這條途徑中的關(guān)鍵酶。在八爪金龍轉(zhuǎn)錄組數(shù)據(jù)中,共注釋得到126 條Unigenes 注釋到苯丙素生物合成代謝通路。編碼香豆素生物合成途徑的5 種關(guān)鍵酶,包括5 條PAL 序列(最高FPKM=74.58),2 條C4H 序列(最高FPKM=42.90),2 條COMT 序列(最高FPKM=54.82),1 條C3H 序列(最高FPKM=25.32),僅鑒定出來1 條4CL(FPKM=0.23)(表4和圖5),因此可以通過增強4CL 基因的表達,以增加整條代謝通路的通量。
2.5.2 黃酮類化合物合成相關(guān)基因的挖掘 根據(jù)KEGG 途徑分析結(jié)果,以及八爪金龍化學(xué)成分分析結(jié)果,并參考相關(guān)文獻報道[38-40],對八爪金龍中主要黃酮類化合物的生物合成途徑作出預(yù)測,見圖4。在黃酮類成分合成途徑中,查耳酮合酶(chalcone synthase,CHS)、查耳酮異構(gòu)酶(chalcone isomerase,CHI)和黃酮合酶(flavone synthase,F(xiàn)NS)起著重要的作用。八爪金龍黃酮合成途徑的上游階段CHS(最高FPKM=841.87)和CHI(最高FPKM=36.55)基因的表達量相對較高。編碼CHS 的Unigenes 數(shù)量為9 條,其各條Unigenes 的表達量不同,其Unigene_186235表達量達到841.87(圖5)。二氫黃酮3-羥化酶(flavonoid 3-hydroxylase,F(xiàn)3H,最高 FPKM=107.65)可以催化柚皮素/槲皮素生成二氫黃酮醇類,黃酮醇合酶(flavonol synthase,F(xiàn)LS)分別催化二氫黃酮醇類生成黃酮醇,F(xiàn)LS 作為合成各種黃酮醇類的關(guān)鍵酶基因其表達量(最高FPKM=9.65)很低(圖5),直接限制了黃酮醇類的合成;柚皮素/槲皮素可以在FNS 生成黃酮類。同時,二氫黃烷醇4-還原酶(dihydroflavonol-4-reductase,DFRA)(最高FPKM=68.43)的高表達致使下游花青素合成支路通量大(圖5),間接降低黃酮醇類合成量,為了提高八爪金龍黃酮醇類的含量,也可通過降低抑制二氫黃酮還原酶(dihydroflavonol reductase,DFR)的表達來實現(xiàn)。無色花色素類可以在無色花色素還原酶(leucoanthocyanidin reductase,LAR)作用下可以生成黃烷醇類。根據(jù)Unigenes 的KEGG 途徑,篩選到可能編碼黃酮合成途徑酶的一些Unigenes,作為進一步分析的候選基因。
圖4 八爪金龍香豆素類和黃酮類物質(zhì)生物合成途徑Fig.4 Main coumarin and flavone biosynthesis pathway in A.crispa
表4 編碼香豆素、黃酮類和萜類生物合成相關(guān)酶的Unigenes 數(shù)量Table 4 Number of Unigenes encoding enzyme involved in coumarin,flavone,and terpenoid biosynthesis
續(xù)表4
圖5 生物合成關(guān)鍵基因的表達量Fig.5 Expression of key genes in biosynthesis
2.5.3 萜類化合物合成相關(guān)基因的挖掘 根據(jù)Unigenes 的KEGG 途徑聚類結(jié)果,其中與萜類合成相關(guān)的的代謝通路共有3 條,包括萜類化合物骨架生物合成(terpenoid backbone biosynthesis),其他萜類化合物生物合成(ubiquinone and other terpenoid-quinone biosynthesis)和倍半萜和三萜類化合物生物合成(sesquiterpenoid and triterpenoid biosynthesis),共計143 條Unigenes。萜類化合物均來源于C5 單元構(gòu)建異戊二磷酸(isopentenyl diphosphate,IPP)及其同分異構(gòu)體二甲基烯丙基二磷酸(dimethylallyl diphosphate,DMAPP),由甲戊酸(mevanolate,MAV)和甲基赤蘚糖醇磷酸(methyl-D-erythritphosphate,MEP)2 個途徑合成(圖6)。在八爪金龍轉(zhuǎn)錄組數(shù)據(jù)中,共發(fā)現(xiàn)14 個Unigenes 可能編碼MVA 途徑中的關(guān)鍵酶乙酰輔酶A 酰基轉(zhuǎn)移酶(acetyl-CoA acetyltransferase,AACT)、羥甲基戊二酰輔酶A 合酶(3-hydroxy-3-methylglutaryl-CoA synthase,HMGS)、3-羥基-3-甲基戊二酰輔酶 A 還原酶( 3-hydroxy-3-methylglutaryl coenzyme A reductase,HMGR),甲羥戊酸激酶(mevalonate kinase,MVK)和甲羥戊酸二磷酸脫羧酶(mevalonate diphosphate decarboxylase,MDD)(表4)。但其HMGS 和HMGR 的表達量均不高(圖5),HMGS 的最高表達量為11.59,HMGR的最高表達量為6.48,因此可以增強HMGS和HMGR基因的表達,以增加MAV 代謝通路的通量。8 個Unigenes可能編碼MEP途徑中的1-脫氧-D-木酮糖-5-磷酸合酶(1-deoxyxylulose-5-phosphate synthase,DXS)、1-脫氧-D-木酮糖-5-磷酸還原異構(gòu)酶(1-deoxy-d-xylulose-5-phosphate reductoisomerase,DXR)、2-C-甲基-D-赤蘚糖醇4-隣酸胞苷酸轉(zhuǎn)移酶( 2-C-methyl-D-erythritol 4-phosphate cytidylyltrans ferase,MCT)、4-(胞苷-二磷酸)-2-C-甲基-D-赤蘚糖醇激酶(4-diphosphocytidyl-2-C-methyl-D-erythritol kinase,CMK)、4-羥基-3-甲基丁-2-烯基二磷酸還原酶(4-hydroxy-3-methylbut-2-en1yldiphosphate synthase,HDS)、4-羥基-3-甲基丁-2-烯基二磷酸還原酶(4-hydroxy-3-methylbut-2-enyl diphosphatereductase,HDR)(表4)。但其DXR 和MCT 的表達量較低(圖5),DXR 的最高表達量為0.65,MCT 的最高表達量為3.95,較低的表達量可能限制了MEP 途徑的合成。萜類化合物均來源于C5 單元構(gòu)建IPP 及其同分異構(gòu)體DMAPP,同時催化中間體產(chǎn)生所需的酶,在八爪金龍轉(zhuǎn)錄組數(shù)據(jù)中均找到編碼相應(yīng)酶的候選基因,其中包括 6 個牛兒基焦磷酸合酶(geranylgeranyl diphosphate synthase,GGPPS)、4個法尼基二磷酸合酶(farnesyl diphosphate synthase,F(xiàn)PS)、2 個鯊烯合酶(squalene synthase,SQS)、2 個鯊烯環(huán)氧酶(squalene epoxidase,SQE)、2 個β-香樹脂合成酶(beta-amyrin synthase AS,β-AS)等(表4)。
圖6 八爪金龍萜類物質(zhì)生物合成途徑Fig.6 Main terpenoid biosynthesis pathway in A.crispa
2.5.4 次生代謝后修飾酶 骨架形成后需要經(jīng)過母核的氧化、糖基化等后修飾的反應(yīng)才能形成結(jié)構(gòu)各異的成分,在萜類、黃酮、生物堿等次生代謝物的衍生修飾過程中,細胞色素P450(cytochrome P450,CYP450)和糖基化轉(zhuǎn)移酶(UDPglycosyltransferase,UGT)主要起催化氧化/羥基化和糖基的重要作用。通過搜索八爪金龍轉(zhuǎn)錄組Swiss-Prot 數(shù)據(jù)庫注釋結(jié)果,共找到 140 條Unigenes 被注釋為CYP450,隸屬于24 個CYP450家族,其中CYP71 家族的Unigenes 最多(22 條),其次是CYP94 和CYP704,分別為15 條和14 條。113條Unigenes 被注釋為UGT,隸屬于24 個UGT 亞家族,包括16 條UGT85,14 條UTG73,10 條UTG80,9 條UTG89 和8 條UTG74 等。對各個樣品中基因表達量進行聚類表達分析,結(jié)果如圖7所示,其中 CYP450 家族 FPKM 值較高的有CYP72A219(FPKM =206.71)、CYP704C1( FPKM =131.60) 和 CYP94A1( FPKM =131.18),UTG 家族FPKM 值較高的有UGT92A1(FPKM=278.69)、UGT73C3(FPKM=171.20)和UGT89B1(FPKM=125.18)。
圖7 次生代謝后修飾酶CYP450 和UGT 表達模式聚類熱圖Fig.7 Heat map of differential gene expression of CYP450 and UGT
2.5.5 其他次生代謝產(chǎn)物生物合成通路 八爪金龍中還含有生物堿和內(nèi)源性激素等生長調(diào)節(jié)物質(zhì),根據(jù)KEGG 代謝通路分析結(jié)果,有2 條代謝通路可能參與八爪金龍生物堿合成代謝途徑,包括30 條Unigenes 參與莨菪烷類、哌啶、吡啶生物堿生物合成,28 條Unigenes 參與異喹啉類生物堿生物合成。分別有51、30、1 條Unigenes 參與類胡蘿卜素、玉米素、花青素等的生物合成。
轉(zhuǎn)錄因子能夠激活或抑制植物次生代謝產(chǎn)物生物合成途徑中功能基因的表達,從而調(diào)控次生代謝產(chǎn)物合成積累。根據(jù)各種轉(zhuǎn)錄因子的隱馬氏模型文件,利用HMMER 3.0 軟件對八爪金龍轉(zhuǎn)錄組數(shù)據(jù)進行搜索。結(jié)果顯示八爪金龍轉(zhuǎn)錄組數(shù)據(jù)預(yù)測共有1265 個Unigenes 被注釋為轉(zhuǎn)錄因子,分屬于64種轉(zhuǎn)錄因子類型。最多的轉(zhuǎn)錄因子類型是MYB類(v-myb avian myeloblastosis viral oncogene homolog ) ( 125 個),AP2/ERF-ERF 類(APETALA2/ethylene-responsive factor)(105 個),鋅指蛋白C2H2 類(Cys2His2)81 個,bHLH 類( basic helix-loop-helix ) 78 個,NAC 類(NAM/ATAF/CUC)66 個,WRKY 類64 個,C3H類(Cys3-His)61 個,bZIP 類(basic leucine zipper)類55 個,GRAS 類[根據(jù)GAI(gibberellic acid insensitive),RGA(repressor of GA1-3 mutant)和SCR(scarecrow)的特征字母而來]48 個,。MYB 轉(zhuǎn)錄因子基因家族與類黃酮生物合成緊密相關(guān)。
利用MISA 軟件對八爪金龍轉(zhuǎn)錄組Unigenes 進行SSRs 分析,共發(fā)現(xiàn)17 400 個SSR 位點,SSR 序列總長度為308 795 bp,包括1245 個復(fù)合型SSR 和16 155 個完美型SSR,分布在12 334 條Unigenes 中,其發(fā)生頻率與分布頻率分別為48.96%和69.07%,1條Unigene 中最多分布7 個SSR。單堿基重復(fù)SSR 共8628 條(53.41%),雙堿基重復(fù)SSR 共5937 條(36.75%),三堿基重復(fù)SSR 共1403 條(8.68%),四堿基、五堿基、六堿基重復(fù)SSR 總共為187 條(1.16%)。八爪金龍轉(zhuǎn)錄組SSR 重復(fù)單元的重復(fù)次數(shù)主要分布在5~36 次,SSR 重復(fù)單元主要以5~14 次的重復(fù)為主,共有14 937 個SSR 位點,占總重復(fù)單元的92.46%;15~36 次的重復(fù)有12 186 個SSR 位點,占SSR 總數(shù)的8%以下;20 次以上的重復(fù)次數(shù)最少,僅有20 個SSR 位點,并且以單堿基重復(fù)為主(圖8)。
圖8 八爪金龍轉(zhuǎn)錄組SSR 不同重復(fù)類型和重復(fù)次數(shù)的數(shù)量分布Fig.8 Quantitative distribution of different motif lengths and repeats in SSR of A.crispa transcriptome
本研究運用Illumina HiSeq 4000 高通量測序平臺對八爪金龍進行轉(zhuǎn)錄組測序,獲得了52 249條Unigenes,平均長度為1440 nt,N50為2336 nt?;蚬δ茏⑨尳Y(jié)果顯示31 391 條Unigenes 被成功注釋到數(shù)據(jù)庫中,占全部Unigenes 的60.07%。18 741 條Unigenes 被注釋到25 種KOG 類群中,其中注釋到“次生代謝物的生物合成、運輸和分解代謝”類群的Unigenes 有681 條;KEGG 路徑注釋結(jié)果顯示八爪金龍中Unigenes 主要參與萜類、生物堿、黃酮類等生物合成相關(guān)的18 個次生代謝通路。近年來,大量藥用植物的生長發(fā)育狀態(tài)和次生代謝產(chǎn)物合成機理通過轉(zhuǎn)錄組分析得到闡明,八爪金龍注釋信息的完成為基因組信息缺乏的八爪金龍次生代謝產(chǎn)物的生物合成的研究提供了新的方向。
PAL 在植物的次生代謝尤其是在苯丙烷類代謝中有關(guān)鍵作用,為連接初級代謝和苯丙烷類代謝、催化苯丙烷類代謝途徑第一步反應(yīng)的酶,是苯丙烷類代謝的關(guān)鍵酶和限速酶[41],該基因在植物中為多拷貝基因[42-43]。Koukol 等[44]1961年首次從高等植物中成功分離并純化,目前已在多種植物中測到PAL 基因的序列。本研究在八爪金龍中共鑒定出5 條PAL 序列,其中主要表達的序列有1 條(FPKM=74.58),PAL 家族一般僅少量基因表達其余同源基因沉默[45-46]。八爪金龍黃酮合成途徑的上游階段4CL 基因的表達量相對較低,4CL是苯丙氨酸途徑中的關(guān)鍵性限速酶,香豆酸在4CL的作用下形成香豆酰-CoA[47]。但實驗也發(fā)現(xiàn)通過轉(zhuǎn)錄組測序鑒定出6 條4-香豆酰CoA 連接酶類似物Unigenes,可能增強4CL 基因的表達,增加了整條代謝通路的通量。二氫黃酮類化合物能在IFS 酶的催化下將芳香基團從2 位向3 位轉(zhuǎn)移生成異黃酮類化合物[48]。但在八爪金龍中未鑒定到IFS 酶,目前八爪金龍中也沒有發(fā)現(xiàn)異黃酮類物質(zhì)。八爪金龍中黃酮類代謝通路中,二氫黃酮類化合物可能通過FNS 合成黃酮類,或者通過F3H 合成二氫黃酮醇類物質(zhì)。
八爪金龍三萜類物質(zhì)是其次生代謝產(chǎn)物的重要組成部分,而其含量和組分又主要取決于生物合成關(guān)鍵酶以及在細胞中的表達水平。植物中三萜類物質(zhì)的生物合成的前體是由MVA 途徑和MEP 途徑共同合成的IPP 或其異構(gòu)體DMAPP[49]。在八爪金龍轉(zhuǎn)錄組的KEGG 注釋中,共篩選到143 個參與三萜合成上游部分基因,分別屬于MVA 途徑和MEP途徑的各個環(huán)節(jié)。整個過程涉及多個酶,因此關(guān)鍵酶的確定至關(guān)重要。
CYP450 是植物體內(nèi)一類超基因家族編碼的單加氧酶,具有廣泛的催化活性,能夠催化多種初級和次級代謝反應(yīng),主要用于涉及萜類、生物堿類、甾醇類、黃酮類、異黃酮等的合成和代謝反應(yīng)等[50-51]。在八爪金龍的轉(zhuǎn)錄組中總共有140 個Unigenes 被注釋為CYP450 基因。UDP-糖基轉(zhuǎn)移酶( uridine diphosphate-glycosyl-transferases,UGTs)參與次生代謝產(chǎn)物合成的最后階段,對于生物活性成分終端產(chǎn)物的多樣性、穩(wěn)定性和結(jié)構(gòu)修飾具有重要意義[52]。在本研究八爪金龍的轉(zhuǎn)錄組中總共有113條Unigenes被注釋為UGTs。八爪金龍藥用部位是根,藥材采挖過程中地上莖、葉及花部則棄之不用。如何結(jié)合不同部位次生產(chǎn)物合成及積累特點進行新藥用部位的開發(fā)研究,合理利用資源,值得深入探討。下一步將選擇相關(guān)關(guān)鍵酶基因,基于qRT-PCR 進行系統(tǒng)的定量表達分析,并開展不同部位八爪金龍黃酮類、三萜類物質(zhì)合成和積累等相關(guān)基礎(chǔ)性研究工作。
轉(zhuǎn)錄組測序技術(shù)可以從合成途徑入手,從整體水平上了解各個酶與產(chǎn)物的關(guān)系,從而克服單個酶的表達與產(chǎn)物關(guān)系的局限性。本研究對八爪金龍進行轉(zhuǎn)錄組學(xué)研究,構(gòu)建八爪金龍轉(zhuǎn)錄組數(shù)據(jù)庫,極大地豐富了八爪金龍的基因資源,為更深入地研究八爪金龍次生代謝合成及調(diào)控提供基礎(chǔ)數(shù)據(jù),為闡明八爪金龍的次生代謝合成機制奠定了基礎(chǔ)。同時SSR 分子標記可以用來分析八爪金龍的遺傳多樣性、構(gòu)建遺傳圖譜和分子標記輔助育種等。
利益沖突所有作者均聲明不存在利益沖突