郭紹貴,許 勇(編譯)
(北京市農(nóng)林科學院蔬菜研究中心 北京 100097)
目的與意義:西瓜是一種重要的葫蘆科作物,占全世界蔬菜生產(chǎn)面積的7%。經(jīng)過長期人工選育,西瓜遺傳多樣性變的十分狹窄,已成為西瓜品種改良的瓶頸。本研究以東亞類型高品質西瓜品種‘97103為材料進行西瓜全基因組序列分析,并開展20份代表性西瓜資源的基因組重測序分析,以明確西瓜基因組結構和進化歷程,闡明果實品質和維管束信號傳導等重要生物學過程的分子機制。
材料與方法:利用Illumina GAII測序平臺進行‘97103基因組高通量測序?;凇?7103×PI296341-FR F8重組自交系群體構建高密度遺傳圖譜進行scaffold錨定。利用PILER、RepeatScout、LTR_FINDER、RepeatProteinMask和RepeatMasker進行基因組重復序列注釋。利用Augustus、GlimmerHMM、BLAT、TBLASTN和GLEAN進行基因預測整合?;赟wissProt、TrEMBL、Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進行基因功能注釋。利用OrthoMCL進行基因家族分析,MRBAYES構建系統(tǒng)進化樹。通過Pfam和SMART數(shù)據(jù)庫比對鑒定基因組抗病基因。利用454測序平臺進行果實發(fā)育轉錄組分析。
結果與分析:(1)‘97103測序組裝獲得了353.5 Mb基因組序列,覆蓋了西瓜全基因組大小的83.2%,共包含1 793個scaffolds (≥500 bp),scaffold和contig的N50長度分別為2.38 Mb和26.38 kb。共有234個scaffold錨定到西瓜11條染色體,覆蓋了西瓜基因組大小330 Mb,占基因組組裝序列的93.5%。西瓜基因組共預測出23 440個蛋白編碼基因,其中約85%的基因被功能注釋。(2)利用熒光原位雜交技術分析發(fā)現(xiàn),10份現(xiàn)代栽培西瓜(C. lanatus subsp. vulgaris)和6份半野生西瓜(C. lanatus subsp. mucosospermus)的5S和45S分布與97103基因組上的rDNA分布一致,而野生西瓜(C. lanatus subsp. lanatus)基因組含有1個45S和2個5S rDNA簇,其中一個5S rDNA簇位于染色體11短臂,表明在西瓜進化過程中染色體可能發(fā)生了融合、斷裂和倒位事件。這一發(fā)現(xiàn)進一步證實了三個西瓜亞種的系統(tǒng)進化關系。根據(jù)雙子葉植物古六倍體化事件,我們提出了從7條祖先染色體到現(xiàn)代西瓜11條染色體的進化模型。(3)本研究對20份代表性西瓜資源進行了基因組重測序分析,共鑒定出678萬個SNP和96萬個Indel。遺傳多樣性分析表明,野生西瓜具有更高的遺傳多樣性,說明利用野生西瓜進行種質改良有很大的潛力。進一步通過鄰接樹法和主成分分析方法研究了西瓜種質資源的群體結構關系,結果顯示,栽培西瓜C. lanatus subsp. vulgaris和半野生西瓜C. lanatus subsp. mucosospermus的關系更近。(4)群體進化分析共鑒定出108個選擇性清除區(qū)域,覆蓋基因組7.78 Mb,包含741個基因。我們發(fā)現(xiàn)與西瓜重要性狀生物學過程有關的候選基因受到進化選擇,如碳水化合物利用調節(jié)、糖介導的信號傳導、碳水化合物代謝、蔗糖刺激響應、氮素代謝調節(jié)、低氮脅迫細胞響應和生長等。3號染色體3.4~5.6 Mb區(qū)域鑒定出一個包含12個S-locus蛋白激酶串聯(lián)排列的基因簇。同時,植物抗逆相關基因與品質性狀相關基因(如碳水化合物代謝、果實風味和種子含油量等)也富集在該區(qū)域。(5)抗病性改良一直是西瓜育種的主要目標。西瓜基因組共鑒定出44個NBS-LRR基因。分析發(fā)現(xiàn),NBS-LRR基因為獨立進化,而LOX基因家族經(jīng)歷了一個快速擴張過程。我們進一步鑒定了197個receptor-like基因,具有染色體成簇分布的顯著特征,表明串聯(lián)復制可以是這些抗病基因的進化基礎。(6)我們分別從西瓜和黃瓜維管束鑒定出13 775和14 242個mRNA,從西瓜和黃瓜韌皮部汁液中分別獲得了1 519和1 012個轉錄本。分析發(fā)現(xiàn)西瓜和黃瓜維管束中獲得的基因基本一致,而韌皮部汁液中的轉錄本僅50%~60%為兩者共有。GO term富集分析顯示,這些共有韌皮部轉錄本主要參與脅迫或刺激響應。(7)西瓜果實發(fā)育是一個復雜的過程。在果實發(fā)育過程中,3 046和558個基因分別在果肉和果皮中差異表達。GO term富集分析顯示,果實發(fā)育過程中果皮和果肉的多個生物學過程相關功能均發(fā)生了顯著變化,如細胞壁形成、類黃酮代謝和防衛(wèi)反應等。而類胡蘿卜素、已糖和單糖代謝過程僅在果肉發(fā)育過程中發(fā)生顯著變化,在基因表達水平上反映了西瓜果肉和果皮之間的主要成熟特性差異。193個轉錄因子在果實發(fā)育過程中顯著差異
表達。其中bZIP基因Cla014572含有SC-uORF結構域,隨著果實發(fā)育而下調表達。MADS-box轉錄因子是果實膨大和成熟過程的重要調控基因?;谙到y(tǒng)進化分析我們在RIN和AGL1分支中分別發(fā)現(xiàn)2個西瓜MADS-box轉錄因子在西瓜果實發(fā)育過程中差異表達。其中Cla009725和Cla019630的表達模式與番茄TAGL1類似,推測它們在西瓜果實發(fā)育過程中具有類似的生物學調控功能。(8)西瓜瓜氨酸代謝途徑分析發(fā)現(xiàn),精氨琥珀酸裂解酶和精氨琥珀酸合成酶家族發(fā)生了基因擴張。其中1個精氨酸琥珀酸裂解酶和2個精氨琥珀酸合成酶基因隨著西瓜果實發(fā)育顯著下調表達,表明成熟果實中的瓜氨酸積累可能是由于瓜氨酸降解活性的下降而引起。
結? ? 論:本研究完成的西瓜基因組框架圖譜是分子生物學研究和遺傳改良的關鍵數(shù)據(jù)資源。我們發(fā)現(xiàn)從半野生西瓜到現(xiàn)代栽培西瓜的馴化過程中,多個基因組區(qū)域受到強烈選擇,進而形成了現(xiàn)代栽培西瓜含糖量高、早熟等生物學特征,而大量抗病基因在從野生西瓜到現(xiàn)代栽培西瓜的進化和人工馴化過程中丟失。結合維管束與果實發(fā)育轉錄組測序,明確了瓜類植株信號傳導和調控、果實成熟糖代謝與調控以及瓜氨酸代謝的基因網(wǎng)絡,為最終闡明葫蘆科作物基因組進化與重要性狀形成的分子機制等理論研究奠定了重要基礎。