◎文/陸婉清(安徽省科學技術情報研究所)
茶樹起源于我國西南地區(qū),并通過古絲綢之路傳播至世界各地,目前全世界已有50多個國家引種茶樹。茶之所以廣受歡迎,除了有迷人的香氣和令人愉悅的滋味,還因為茶葉中含有許多對人們健康有益的特征性成分,諸如茶多酚、茶氨酸、咖啡因、茶多糖、維生素、芳香油和礦物質等。我國現(xiàn)存最早的中醫(yī)醫(yī)藥典籍《本草經(jīng)》記載:“神農(nóng)嘗百草,日遇七十二毒,得荼(茶)而解之。”這說明了茶的神奇功效。
茶樹屬于山茶科屬植物,該屬有100多個種植物,但只有茶組植物的葉子適合制茶,而非茶組植物,如茶花、油茶和金花茶等的葉片不能作為茶飲。原因在于茶樹和其他茶組植物富含茶多酚、茶氨酸和咖啡因等。除此之外,茶樹近期(3000萬年~4000萬年前)曾經(jīng)發(fā)生過一次全基因復制事件,加上大量的特異基因家族的擴增,導致茶樹基因組里與茶葉的香氣、風味與品質密切相關的基因顯著擴增,擴增的結果不僅促進茶樹適應全球多樣化環(huán)境,還通過優(yōu)勝劣汰的自然選擇促進了茶樹抗病基因家族的增長,使其成為世界性飲料植物。
世界主要栽培的茶樹分屬兩個變種:中國種(CSS)和阿薩姆種(CSA)。前者葉小,灌木型,抗寒性強,分布廣泛,適合制綠茶等六大茶類;后者葉大,喬木型,抗寒性較弱,主要分布在熱帶和冬季溫暖的亞熱帶地區(qū),適合制紅茶和普洱茶。中國擁有3000多年的飲茶歷史,是世界上最大的茶葉種植國。來自國際茶樹委員會的數(shù)據(jù)顯示,2016年,全球茶葉產(chǎn)量546.3萬噸,其中中國產(chǎn)茶量235萬噸。然而,在世界三大飲料植物中,咖啡和可可的基因組相繼被歐美國家完成了測序,世界栽培最廣的中國種茶樹基因組卻遲遲未被破譯。
茶樹是一種自交不親和的異交植物,種間頻繁雜交導致基因組雜合度高(2.8%)。在過去5000萬年以來,茶樹基因組中長末端重復序列反轉錄轉座子家族經(jīng)歷了多次特別是近期的大量爆發(fā),它們長期而緩慢地擴增,卻又缺少有效的DNA刪除機制,導致茶樹基因組變得十分龐大(約3.0G)且重復序列含量極高,致使獲得高質量參考基因組難度極大。
安徽農(nóng)業(yè)大學茶樹生物學與資源利用國家重點實驗室宛曉春教授研究團隊,聯(lián)合深圳華大基因和中國科學院國家基因研究中心(上海)等相關研究團隊,解密了中國種茶樹的全基因組信息,研究成果在線發(fā)表于《PNAS》上。
中國種茶樹基因組組裝。研究團隊以國家級茶樹品種舒茶早(中國種)為材料,整合二代Illumina Hiseq2000和三代PacBio兩大測序平臺的優(yōu)勢,采用雜合組裝策略,獲得了高質量的茶樹全基因組信息。分析發(fā)現(xiàn),中國種基因組大小為3.1G,重復序列含量為64%;組裝的contig、scaffold N50 長度分別為 67.07kb、1.39Mb,注釋得到33932個高可信度的蛋白編碼基因 (見圖1A)。通過BAC文庫測序數(shù)據(jù)、其他的DNA序列和ESTs序列對組裝的準確度及完整性進行評估,同時與已報道的大葉種(阿薩姆種)基因組進行了比較分析。BACs評估發(fā)現(xiàn)中國種茶樹基因組覆蓋度達到了98.3%,而阿薩姆種茶樹只有84.6%。同時BUSCO保守核心真核基因評估結果顯示中國種茶樹僅缺失6個保守基因(占2%),而阿薩姆種茶樹缺失16個保守基因(占5.2%)。來源于GeneBank的茶樹EST序列評估結果顯示,中國種茶樹覆蓋度為93%,而阿薩姆種茶樹為89%。
圖1 中國種茶樹基因組圖譜
中國種茶樹基因組進化研究。研究發(fā)現(xiàn)茶樹原始祖先種與獼猴桃的物種分化時間大約發(fā)生在8000萬年前,阿薩姆種茶樹和中國種茶樹在38萬年~154萬年前由共同祖先發(fā)生進化分歧。兩者間DNA、蛋白直系同源基因的平均序列相似性分別為92.4%、93.9%(見圖1B)。開花植物在進化歷史中往往會存在全基因復制事件,并且這些基因與農(nóng)藝或植物特異性性狀相關?;蚬簿€性分析發(fā)現(xiàn)茶在歷史進程中發(fā)生了兩次全基因復制事件,分別發(fā)生在9000萬年~1億年前和3000萬年~4000萬年前。
圖2 茶樹及6種近緣植物SCPL1A基因家族進化
兒茶素類物質是形成茶葉風味的主要特征性次生代謝物。茶樹中之所以富含該類物質,與其關鍵合成酶基因擴增有關。研究發(fā)現(xiàn),近期的全基因組復制事件及后續(xù)串聯(lián)復制導致了大多數(shù)次生代謝相關基因拷貝數(shù)顯著擴增。值得關注的是,涉及包括兒茶素在內的小分子次生代謝產(chǎn)物?;磻孽;D移酶(SCPL)基因發(fā)生大量擴增,其中的18%是由近期全基因組復制事件產(chǎn)生的,而68%則是通過近期串聯(lián)重復產(chǎn)生(見圖2)。兒茶素的生物合成受到復雜的轉錄調控,許多與生物逆境和非生物逆境相關的轉錄因子都與兒茶素含量高度相關(見圖3)。
圖3 茶樹兒茶素生物合成通路關鍵酶基因表達與進化
圖4 茶樹茶氨酸代謝通路關鍵酶基因進化與功能驗證
咖啡堿是茶葉中主要苦味物質。研究發(fā)現(xiàn)茶樹中咖啡堿合成途徑在進化上獨立于可可和咖啡,合成咖啡堿的關鍵酶基因拷貝數(shù)擴增也是通過茶樹近期全基因組復制事件和后續(xù)的串聯(lián)復制產(chǎn)生的。
茶氨酸是決定綠茶鮮爽味的主要物質。研究發(fā)現(xiàn)并驗證了一個參與茶氨酸合成的關鍵酶基因(CsTSI),通過表達模式分析、乙銨誘導處理、轉基因分析都證明CsTSI具有合成茶氨酸的酶活性(見圖4)。
通過與其他10種代表性的植物基因組比較發(fā)現(xiàn),與茶葉風味相關的萜烯類等物質的合成酶基因在茶樹基因組中也有顯著擴增。
基礎研究。高質量基因組圖譜的成功繪制揭示了決定茶葉適制性和風味物質形成的基因信息,將進一步推動茶組植物基因組進化、茶樹起源和遺傳多樣性、茶葉特征性次生代謝物形成機理等重大基礎生物學問題的研究。
科學育種。中國種茶樹全基因組的破譯,將大大加速茶樹功能基因組學研究和優(yōu)異新基因及分子標記發(fā)掘,加快提高茶葉品質和適應性的茶樹新品種培育,使茶樹品種按生產(chǎn)和市場的需求方向培育成為可能。
品種保護。基于茶樹基因組信息,可以開發(fā)用于茶樹品種鑒定與保護的分子指紋,進而為保護品種選育人和消費者合法權益提供技術支持。
文化傳播。中國種茶樹基因組圖譜的完成,將因其獨特的科技與文化魅力促進中國文化的傳播,通過多樣化的風味,在全球滿足和吸引更多的茶飲者,將中國茶和茶文化弘揚光大。