郭紹貴 劉景安 鄭軼 黃明云 張海英 宮國義 何洪巨 任毅 鐘思林 費章君 許勇
目的與意義:目前關于西瓜果實在分子水平上發(fā)育和成熟的信息非常少,栽培西瓜是一種非呼吸越變型水果。到目前為止,只有一份報告描述了西瓜果實發(fā)育過程中一小部分基因的表達,對西瓜進行了大規(guī)模的轉錄組測序,以期對西瓜果實發(fā)育過程中的分子基礎有更多了解。
材料與方法:使用西瓜自交系‘97103作為試驗材料,在西瓜成熟過程中的白肉階段、粉肉、紅肉和過熟階段分別測序cDNA,進行cDNA序列處理、組裝、注釋和比較基因組學分析,鑒定西瓜差異表達的基因,測定糖、可溶性固形物和類胡蘿卜素的含量以及果肉硬度,qRT-PCR分析2個糖代謝基因。
結果與分析:通過使用焦磷酸測序技術對西瓜果實發(fā)育過程中4個階段的cDNA樣品進行測序。4個階段分別是:白肉階段(10 DAP),粉色果肉(18 DAP),紅色果肉(26 DAP)和過熟(34 DAP),獲得了總共577 023個高質量的EST,平均長度為302.8 bp,總長度為174.7 Mb。組裝了包括大約8 000個EST,這些ESTs分布在4 616個unigenes中,在454個深度轉錄組測序后962個unigenes(20.8%)未被捕獲。這表明盡管454個深度測序產(chǎn)生了大量新的 unigenes(超過70 000),但是只有將轉錄組測序到更深度的水平才能發(fā)現(xiàn)更多的稀有基因。
為了注釋西瓜轉錄組,使用BLASTX程序將單基因序列與NCBI非冗余(nr)蛋白質數(shù)據(jù)庫進行比較。分析顯示,41 245(54.9%),20 648(27.5%)和4 493(5.9%)的unigenes與已知蛋白質序列匹配。比較了西瓜unigenes與pfam域數(shù)據(jù)庫,總共11 454個水溶性unigenes含有至少一個由unigenes代表的pfam結構域和1 475個不同pfam結構域。發(fā)現(xiàn)465個unigenes含有轉錄因子的結構域,代表性最高的pfam轉錄因子結構域是PF00319、PF00847、PF00046和PF01486。然后將基因GO注釋到它們UniProt數(shù)據(jù)庫中的已知蛋白質,共有33 853個unigenes(45.1%)被分配至少一個GO注釋,其中在生物過程類別的28 987個(38.6%)被分配到至少一個GO注釋中,28 997個unigenes(38.6%)分配在分子功能類別中,細胞成分類別中有27 036(36%),而在所有3個類別中,21 779(29%)unigenes被指定為GO注釋。GO注釋揭示了大量基因參與碳水化合物代謝過程(1 807),解剖結構形態(tài)發(fā)生(1 687),細胞氨基酸和衍生物代謝過程(1 595),以及次級代謝過程(992)。
篩選了水溶性二烯,三-,四-,五-和六-核苷酸SSR堿基序列,并能夠預測4 668個西瓜unigenes的5 195個SSR,其中2 265、2 709、11 557和49個分別是二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸SSR(簡單重復序列)基序。最常見的SSR基序是AG / CT(1 616; 31.1%),其次是AAG / CTT(1 300; 25%),AT/AT(519;10%)和AAT/ATT(465; 9%)。在本研究中確定的SSR標記提供給了西瓜重要的分子標記資源。然而,這些SSR的多態(tài)性需要在特定的群體中進行測試。
根據(jù)差異表達的基因分類為不同的類別:1)在西瓜成熟的4個階段中的每個階段都高度表達的基因; 2)在西瓜成熟早期階段高度表達的基因; 3)在西瓜成熟晚期高度表達的基因。蔗糖、果糖和葡萄糖,這3種糖類決定了果實的甜度和3種類胡蘿卜素(番茄紅素、β-胡蘿卜素和葉黃素)含量,這些類胡蘿卜素在果實著色中起關鍵作用(原圖5)。另外,通過數(shù)據(jù)分析發(fā)現(xiàn)許多細胞壁相關基因在未成熟的白色果實中有更高的表達,包括PRPs(富含脯氨酸的蛋白),阿拉伯半乳聚糖蛋白(FLAs),木葡聚糖內轉糖基酶(XETs)。在未成熟的白肉階段,由于番茄紅素開始的積累,西瓜果肉組織開始變成粉紅色。確定了在西瓜果實發(fā)育中4個階段3種主要胡蘿卜素、番茄紅素、β-胡蘿卜素和葉黃素的含量,結果顯示,番茄紅素是果實中的主要類胡蘿卜素。所得數(shù)據(jù)證實了糖代謝的大致趨勢,蔗糖占成熟果實中總可溶性糖的約50%,而未成熟和白粉色果肉中的果實含量為3%~7%。作者鑒定了在西瓜果實發(fā)育過程中差異表達的蔗糖合成酶和蔗糖磷酸合成酶,這2個基因參與蔗糖的生物合成,并在紅色果肉和過熟階段在果實中高度表達。
結? ? 論: 西瓜是一種重要的經(jīng)濟水果作物,而且西瓜是非呼吸越變型水果的研究資源。但是西瓜的遺傳資源和基因組資源十分匱乏,這是西瓜研究和育種的主要限制性因素之一。上文中在西瓜4個不同的生長發(fā)育階段中使用焦磷酸測序技術獲得了大約50萬左右的ESTs,這些ESTs被de novo組裝并廣泛注釋,這代表了西瓜轉錄本目錄的擴展,為將來某些感興趣基因的功能和表達分析提供了全面的物質基礎。這些ESTs也將有助于注釋現(xiàn)階段正在測序的西瓜基因組,基因表達的數(shù)字化和代謝譜的綜合分析為進一步探索西瓜果實發(fā)育的分子機制和西瓜果實品質性狀的調控機制提供了新的思路。