趙雪艷 李思鋒 柏國清 李為民
(陜西省西安植物園,陜西省植物研究所,陜西省植物資源保護(hù)與利用工程技術(shù)研究中心,西安 710061)
百合屬(Lilium)是百合科(Liliaceae)百合族(Lilieae)中一個(gè)具有重要經(jīng)濟(jì)價(jià)值和系統(tǒng)發(fā)育研究意義的屬。百合是多年生的球根類草本植物,許多百合種和品種花姿百態(tài)、芳香怡人、花色豐富,是世界上十大切花之一,也是盆栽、園林綠化和點(diǎn)綴庭院的名貴花卉[1],有關(guān)花發(fā)育相關(guān)基因的研究具有重要的意義。另外,百合中含有豐富的營養(yǎng)物質(zhì),如蛋白質(zhì)、淀粉、葡甘露聚糖和膳食纖維等,同時(shí)也含有多種生物活性化合物,可食用有的種亦可藥用,具有較好的開發(fā)利用價(jià)值和發(fā)開前景[2]。
全球百合屬植物大約有110種,我國野生百合資源最為豐富,是百合屬植物的分布中心之一,約有55 種18 變種,其中35 種15 變種為我國特有種。細(xì)葉百合(L.pumilium)又名山丹,其花下垂,花被片反卷,無斑點(diǎn)或有少數(shù),花朵嬌艷,是著名的野生藥用植物,并具極高的觀賞價(jià)值,是重要的觀賞性花卉。細(xì)葉百合在寒冷的條件下可以越冬,是百合抗性育種的重要親本[3]。中國藥典規(guī)定藥材百合的來源為百合科百合屬植物百合(L. brownii var.viridulum)或細(xì)葉百合的肉質(zhì)鱗葉。具有養(yǎng)陰潤肺,清心安神的功效。主治陰虛燥咳,勞嗽咳血,陰虛有熱之失眠心悸及百合病心肺陰虛內(nèi)熱證[4]。然而,張衛(wèi)等通過系統(tǒng)的本草考證研究認(rèn)為百合科植物野百合(L.brownie)及其變種百合為中國古代藥用百合的正品[5]。卷丹(L.lancifolium)是我國藥食兼用百合品種,具有適應(yīng)性強(qiáng)、抗病和耐寒等優(yōu)勢,可在百合病害高發(fā)地區(qū)推廣種植[6]。川百合(L. davidii)花色艷麗,橙黃色且有紫黑色斑點(diǎn),花被片極度反卷,其鱗莖可食用,具有優(yōu)良的觀賞價(jià)值和較好的食用價(jià)值,并且其抗病性強(qiáng),是良好的抗性育種材料[7]。野百合是我國特有種,花型大而美麗,較好的抗逆性與觀賞利用價(jià)值。本團(tuán)隊(duì)前期采用高通量測序技術(shù)平臺對野百合進(jìn)行轉(zhuǎn)錄組測序,經(jīng)過組裝共獲得47 605個(gè)unigenes。
不同物種之間的比較轉(zhuǎn)錄組研究可以用于快速進(jìn)化基因以及適應(yīng)性相關(guān)基因的研究。Ai等對11 種報(bào)春苣苔屬植物進(jìn)行比較轉(zhuǎn)錄組學(xué)分析,研究了11 種報(bào)春苣苔屬植物的系統(tǒng)進(jìn)化、親緣關(guān)系及適應(yīng)性相關(guān)基因[8]。并且對牛耳朵和黃花牛耳朵的比較轉(zhuǎn)錄組分析,研究兩個(gè)物種在巖溶環(huán)境中的分子適應(yīng)機(jī)制,尋找出與巖溶環(huán)境適應(yīng)有關(guān)的19 對功能基因[9]。趙建花通過對地黃屬5 個(gè)種的轉(zhuǎn)錄組數(shù)據(jù)分析研究地黃屬植物5 個(gè)物種間的系統(tǒng)親緣關(guān)系,發(fā)現(xiàn)二倍體裂葉地黃處在地黃屬的基部,二倍體天目地黃和湖北地黃構(gòu)成姐妹類群,四倍體地黃和茄葉地黃聚成姐妹類群[10]。目前,對百合屬植物的研究主要集中在品種培育、繁殖技術(shù)、栽培、化學(xué)成分以及資源保護(hù)方面。目前只有少數(shù)關(guān)于百合遺傳結(jié)構(gòu)和系統(tǒng)進(jìn)化方面的研究[11~13]。傳統(tǒng)的分類學(xué)研究方法很難解決百合屬物種間的系統(tǒng)發(fā)育問題,揭示百合屬物種在進(jìn)化過程中基因組結(jié)構(gòu)是否發(fā)生變化、種間基因流的變化規(guī)律、潛在的選擇作用等需要基因組層面的研究。本文通過對秦嶺地區(qū)的百合屬4個(gè)物種(細(xì)葉百合、川百合、卷丹和百合)的花進(jìn)行轉(zhuǎn)錄組測序,分析花發(fā)育相關(guān)基因。并結(jié)合本團(tuán)隊(duì)前期的野百合轉(zhuǎn)錄組數(shù)據(jù),分析篩選5種百合屬植物的直系同源基因及正選擇壓力相關(guān)基因,并利用獲取的直系同源基因構(gòu)建百合屬物種的進(jìn)化關(guān)系,為進(jìn)一步研究百合花的發(fā)育和調(diào)控以及百合屬植物進(jìn)化提供依據(jù)。
在陜西朱雀國家森林公園采集4種百合屬(細(xì)葉百合L.pumilum;川百合L.davidii;卷丹L.lanci?folium;百合L. brownii var. viridulum)健康植株的花。迅速放入液氮中速凍,隨后放在-80℃冰箱中保存。
采用Trizol 法提取細(xì)葉百合、川百合、卷丹和百合花中的總RNA。經(jīng)質(zhì)量檢測合格后,用帶有Oligo(dT)的磁珠富集mRNA。然后將mRNA 分裂成短片段,并反轉(zhuǎn)錄合成第一鏈cDNA,隨后合成另一條鏈,從而純化得到的雙鏈cDNA。進(jìn)而修復(fù)雙鏈cDNA 的末端并在其末端加上poly(A)尾巴并連接Illumina 測序接頭。制備測序文庫。委托廣州基迪奧生物技術(shù)公司采用Illumina 雙端測序平臺對4 種百合屬植物的花器官進(jìn)行測序。將獲得的原始數(shù)據(jù)過濾后得到高質(zhì)量的讀序,用Trinity和TGICL 按照默認(rèn)參數(shù)對得到的高質(zhì)量讀序進(jìn)行從頭組裝,得到unigene。
為獲得4 種百合屬植物花的unigene 功能信息,將測序得到的unigene 與公共數(shù)據(jù)庫(Nr、Swiss-Prot、KOG、GO、KEGG)進(jìn)行相似性比對以獲得其基因功能。隨后結(jié)合野百合的轉(zhuǎn)錄組數(shù)據(jù)對百合屬5 種植物(野百合、細(xì)葉百合、川百合、卷丹和百合)unigene的功能注釋結(jié)果進(jìn)行比較,并且分析花發(fā)育相關(guān)基因。
首先使用transdecoder 軟件預(yù)測各物種Unige?ne 中的CDS 區(qū)域,然后利用OrthoMCL 對預(yù)測所得的5 種百合屬植物的CDS 序列進(jìn)行直系同源基因搜索,從中篩選出一對一的直系同源基因[14]。然后用paml-codeml 計(jì)算直系同源基因的非同義替換(Ka),同義替換率(Ks)值,并計(jì)算Ka/Ks 值[15],進(jìn)而篩選出受正選擇作用的基因。
利用GOseq[16]的GO 基因富集方法對受到正選擇的直系同源基因(Ka/Ks>1)進(jìn)行基因分類富集。另外,對受到正向選擇的直系同源基因進(jìn)行Pathway 富集分析[17],尋找受到正向選擇的直系同源基因相對于所有注釋的基因顯著富集的pathway。
采用Illumina HiSeq 2500測序技術(shù)對百合屬4種植物(細(xì)葉百合L.pumilum;川百合L.davidii;卷丹L. lancifolium;百合L. brownii var. viridulum)的花進(jìn)行轉(zhuǎn)錄組測序。獲得的轉(zhuǎn)錄組原始數(shù)據(jù)已上傳到NCBI數(shù)據(jù)庫(SRA編號:SRP253797)。
使用Trinity 軟件對所有reads 進(jìn)行組裝,其中,在細(xì)葉百合中共獲得44 565個(gè)unigene,序列平均長度為701 bp;在川百合中共獲得51 413 個(gè)unigene,序列平均長度為719 bp;在卷丹中共獲得41 638個(gè)unigene,序列平均長度為688 bp;在百合中共獲得44 716個(gè)unigene,序列平均長度為737 bp(見表1)。細(xì)葉百合、川百合、卷丹、百合組裝的unigene的N50長度分別為1 066、1 149、1 017和1 183 bp。
為了獲得本研究中4 種百合屬植物花的基因功能信息,分別將4 個(gè)物種獲得unigene 序列與公共數(shù)據(jù)庫(GO、Nr、Swiss-Prot、KOG、KEGG)進(jìn)行比對(E 值<1E-5)以及基因的功能注釋。5 種植物的unigene在上述公共數(shù)據(jù)庫進(jìn)行注釋結(jié)果顯示細(xì)葉百合、川百合、卷丹和百合中能夠得到注釋的基因的百分比為分別為55.23%、61.54%、56.96% 和48.93%(見表2)。沒有匹配到的基因比較多,這可能是由于目前百合屬植物沒有基因組信息。
表1 百合屬4種植物的測序結(jié)果統(tǒng)計(jì)信息Table 1 Statistical information for transcriptome sequencing of four species of Lilium
表2 百合屬5種植物轉(zhuǎn)錄組注釋信息Table 2 Annotation information of five species of Lilium
GO 注釋結(jié)果顯示細(xì)葉百合、川百合、卷丹和百合分別有6 785、7 398、6 475以及7 360條unige?ne序列得到注釋結(jié)果。GO注釋的結(jié)果主要分為3大類:生物過程、細(xì)胞組分和分子功能。結(jié)果顯示4種植物轉(zhuǎn)錄組的GO注釋結(jié)果相似。在生物過程功能類別中代謝過程和細(xì)胞過程組分中注釋的基因數(shù)目最多;在細(xì)胞組分類別中,注釋最多的基因歸類到細(xì)胞和細(xì)胞組分類別中;而在分子功能類別中,注釋最多的功能類別是催化活性和結(jié)合(見圖1)。這和前期關(guān)于野百合的基因的GO 注釋結(jié)果相似。
將本實(shí)驗(yàn)4種百合屬物種得到的unigene 序列分別與KOG 數(shù)據(jù)庫進(jìn)行比對進(jìn)而預(yù)測其功能,并和野百合的KOG 注釋比較分析。結(jié)果顯示,在25個(gè)功能類別中,“一般功能預(yù)測”類別中的unigene在5種百合屬植物都是最多,其次是“翻譯后修飾,蛋白質(zhì)轉(zhuǎn)運(yùn)和分子伴侶”“信號轉(zhuǎn)導(dǎo)和機(jī)制”以及“RNA的處理和修飾”。在5個(gè)物種均是只有少數(shù)unigene序列注釋到“細(xì)胞運(yùn)動”這一類別中(見圖2)。
百合屬植物是重要的觀花植物,花是百合重要的經(jīng)濟(jì)性狀。通過對百合屬植物花轉(zhuǎn)錄組數(shù)據(jù)的注釋和分析,共鑒別到13個(gè)花發(fā)育相關(guān)基因,包括MADS-box 基因、AGL 類基因和LIM 類基因等(見表3)。
利用保守的單拷貝同源基因序列比對后,采用MEGA 構(gòu)建NJ 樹,其中野百合和細(xì)葉百合聚為一類,卷丹和百合聚為一類,而川百合單獨(dú)為一類(見圖3)。本研究中得到的直系同源基因序列可以用于開發(fā)SSR 位點(diǎn),為百合屬的遺傳標(biāo)記開發(fā)提供資源。
表3 鑒別的花發(fā)育相關(guān)的基因Table 3 Identified genes involved in the development of flower
通過orthomcl analysis 分析,在5 種百合屬植物中共得到9440 對單拷貝直系同源基因,計(jì)算這些直系同源基因的非同義替換(Ka)、同義替換率(Ks)、Ka/Ks。且數(shù)據(jù)經(jīng)過嚴(yán)格過濾后,共有8 247對直系同源基因被確定,其中32 對直系同源基因的Ka/Ks>1,表明這些基因受到了強(qiáng)烈的正向選擇;355 對直系同源基因的0.5 對5 種百合屬植物的正選擇基因進(jìn)行GO 基因功能富集分析發(fā)現(xiàn)正向選擇的基因功能在生物過程(Biological process)分類中主要集中在代謝過程(Metabolic process)上,在細(xì)胞組分(Cellular component)分類中主要集中在細(xì)胞器(organelle)、細(xì)胞(Cell)、細(xì)胞部分(Cell part),而在分子功能(Molecular function)分類中則主要集中在結(jié)合活性(Binding)、催化活性(Catalytic activity)上。強(qiáng)烈正選擇基因的KEGG 富集的結(jié)果發(fā)現(xiàn),在5種百合屬植物中,代謝途徑、萜類骨架的生物合成、苯基丙酸類生物合成以及植物-病原體的相互作用等通路相關(guān)的基因受到了比較強(qiáng)的正選擇作用(見表4)。 目前Illumina 二代測序技術(shù)已經(jīng)成為獲取無參考基因組的物種基因數(shù)據(jù)的一種有效方法,廣泛應(yīng)用于抗性和活性成分基因的挖掘以及分子標(biāo)記的開發(fā)應(yīng)用[18]。不同近緣物種的轉(zhuǎn)錄組測序分析可以預(yù)測物種的選擇作用以及適應(yīng)性進(jìn)化。本研究通過二代轉(zhuǎn)錄組測序比較分析百合屬4 種植物花的轉(zhuǎn)錄組數(shù)據(jù)。通過組裝分別在細(xì)葉百合、川百合、卷丹以及百合的花朵中獲得44 565、51 413、41 638 和44 716 個(gè)unigene 序列。本研究獲得的轉(zhuǎn)錄組數(shù)據(jù)將為未來這4 種植物的研究提供有用的數(shù)據(jù)和資源。 表4 強(qiáng)烈正向選擇的基因的KEGG通路Table 4 The enriched KEGG pathways of strongly positive selection unigenes 將獲得的基因序列在Nr、Swiss-Prot、GO、KOG和KEGG 等公共數(shù)據(jù)庫中注釋,4 個(gè)物種中一半左右的基因在五大數(shù)據(jù)庫中有注釋信息,但是幾乎一半的基因沒有注釋信息,這可能是由于4種植物目前都沒有參考基因組信息,這些基因可能是百合屬特有的一些基因,這和前期關(guān)于野百合的注釋信息類似,都是大約50%的基因能匹配到注釋信息。通過比較本實(shí)驗(yàn)的4 種百合屬植物以及野百合中基因的GO 和KOG 注釋結(jié)果,發(fā)現(xiàn)5種百合屬植物花的轉(zhuǎn)錄本歸屬的分類條目類似,說明5種植物在百合屬內(nèi)親緣關(guān)系較近。 百合是多年生的宿根花卉植物,有球根“花卉之王”的美譽(yù),花的形成和花器官的發(fā)育研究極其重要。本研究通過轉(zhuǎn)錄組數(shù)據(jù)共鑒別了13個(gè)花發(fā)育相關(guān)的基因,控制植物花器官發(fā)育的基因大多數(shù)含有一個(gè)保守的MADS 結(jié)構(gòu)域。其中,MADS2基因參與胚珠的發(fā)育[19],并且Tzeng 等在麝香百合中克隆到了MADS2 基因,MADS2 基因僅在胚珠中表達(dá),在花的其他部位中不表達(dá)[20]。除此之外,目前在麝香百合中還克隆出了MADS1、MADS3 和MADS4基因,它們分別參與雄蕊和花瓣的發(fā)育[21]。在本研究中鑒別到的MADS6基因參與調(diào)控花分生組織的分化和開花時(shí)間[22~23],MADS14 基因調(diào)控開花時(shí)間[22]。Wang 等研究表明過表達(dá)MADS-box 轉(zhuǎn)錄因子BpPI 可以延遲開花[24]。MADS16 基因參與花被和雄蕊的發(fā)育[25~26]。在樺樹中,研究發(fā)現(xiàn)BpAP1 可以促進(jìn)其雄花序的形成[27]。在AGL 基因家族中,AGL104 基因和AGL3 基因參與花粉的成熟與花粉管的生長[28],AGL8 基因參與花分生組織的分化[29]。AGL19 基因可以響應(yīng)春化作用,促進(jìn)開花,而AGL15 基因參與開花的負(fù)調(diào)控[30]。另外,本研究中鑒別到的SOC1 基因和EJ2 基因分別調(diào)控開花時(shí)間以及花的發(fā)育和形成[31]。LIM 類基因LIM15 是與減數(shù)分裂相關(guān)基因,在染色體的配對和重組起重要作用[32]。Mori等在百合中克隆到了與花粉發(fā)育相關(guān)的GlsA基因,其僅僅在花粉的發(fā)育過程中表達(dá)[33]。本研究中鑒別的花發(fā)育相關(guān)基因可以為進(jìn)一步研究百合花器官發(fā)育和調(diào)控提供基礎(chǔ)。 Ka/Ks 值常用來驗(yàn)證蛋白質(zhì)編碼基因是否經(jīng)歷選擇作用。正選擇作用是物種對環(huán)境因素的適應(yīng)手段之一。本研究共檢測到32對強(qiáng)烈的正向選擇基因(Ka/Ks>1)以及355 對弱的正向選擇基因(0.5 在植物病原體的相互作用途徑中,發(fā)現(xiàn)了正選擇基因疾病抗性蛋白RPM1 基因,RPM1 基因是NBS-LRR 基因中的一員,RPM1 基因通過一系列的信號傳導(dǎo)使植物體產(chǎn)生過敏反應(yīng),加強(qiáng)植株的抗病性,造成病原菌感染區(qū)域及周圍組織細(xì)胞程序性凋亡,使病原菌不會擴(kuò)散到健康的組織器官中,從而達(dá)到抗病目的。對大豆灰斑病表現(xiàn)出正向調(diào)控的抗性[34]。過氧化物酶57基因參與苯丙烷類化合物木質(zhì)素的生物合成。苯丙烷類化合物作為植物抗逆保護(hù)因子及特定環(huán)境下的次生代謝產(chǎn)物對植物的生長發(fā)育及應(yīng)答逆境脅迫具有重要作用,特異性調(diào)控苯丙烷代謝途徑相關(guān)基因的表達(dá)可以增強(qiáng)植物對環(huán)境脅迫的抗性[35]。一些研究表明正選擇直系同源基因常常與生物和非生物脅迫、生物合成、代謝過程和酶相關(guān)[9,35~37]。本研究也發(fā)現(xiàn)了抗性以及參與代謝相關(guān)的正向選擇基因。2.5 正選擇基因的GO和KEGG富集分析
3 討論
3.1 百合屬4種植物花的轉(zhuǎn)錄組測序和注釋
3.2 花發(fā)育相關(guān)基因的分析
3.3 百合屬5種植物的直系同源基因以及正選擇基因