房婉萍,雷小剛,楊彬,王亞,馬媛春
南京農(nóng)業(yè)大學(xué)園藝學(xué)院,南京210095
茶樹(shù)(Camellia sinensis(?.)O.Kuntze)是重要的經(jīng)濟(jì)作物,具有數(shù)千年種植歷史。全球超50 個(gè)國(guó)家種植茶樹(shù),茶飲料深受消費(fèi)者的喜愛(ài)[1-2]。據(jù)統(tǒng)計(jì),人類(lèi)每天飲茶超20 億杯,全球茶葉年產(chǎn)量約為500萬(wàn)t,每年由茶帶來(lái)的產(chǎn)值約為57 億美元[3]。茶葉中富含茶多酚、兒茶素和咖啡堿等對(duì)人體健康有益的次生代謝物,是良好的養(yǎng)生保健產(chǎn)品[4]。目前,對(duì)于氨基酸、兒茶素、茶多酚、咖啡堿等茶葉次生代謝物的研究體系較為成熟并且研究得比較深入,但茶樹(shù)分子育種研究相對(duì)滯后[5]。茶樹(shù)基因組的公布不僅加快了茶樹(shù)育種和分子生物學(xué)研究進(jìn)程,還使茶樹(shù)的分子育種研究進(jìn)入一個(gè)“新時(shí)代”。以基因組學(xué)為基礎(chǔ)的許多分子育種技術(shù)如數(shù)量性狀基因座(quantitative trait locus,QT?)定位、轉(zhuǎn)錄組學(xué)研究、分子標(biāo)記選擇、全基因關(guān)聯(lián)分析(genome-wide association analysis,GWAS)等在茶樹(shù)基因組發(fā)表之后得到了快速發(fā)展。鑒于茶樹(shù)約3 Gb 大小的基因組、超過(guò)一半的重復(fù)序列及高度雜合特性,茶樹(shù)基因組學(xué)研究進(jìn)展較為緩慢。2017 年,我國(guó)研究者公布了基于二代測(cè)序技術(shù)獲得的大葉種‘云抗10 號(hào)’茶樹(shù)基因組[6],之后陸續(xù)公布了9個(gè)茶樹(shù)基因組,其中‘舒茶早’、‘黃旦’和‘鐵觀音’等6個(gè)茶樹(shù)品種的基因組達(dá)到參考基因組水平[2,5-12]。茶樹(shù)基因組的相繼公布加速了茶樹(shù)茶樹(shù)生物學(xué)如分子標(biāo)記輔助選擇(marker assisted selection,MAS)、轉(zhuǎn)錄組學(xué)和全基因組關(guān)聯(lián)分析等研究水平和進(jìn)程。在茶樹(shù)基因組公布之前,茶樹(shù)GWAS 研究領(lǐng)域始終處于空白,但是在茶樹(shù)基因組公布后2 a,以茶樹(shù)表型性狀和茶葉次生代謝物為基礎(chǔ)的GWAS得以廣泛開(kāi)展。
GWAS 是一種基于連鎖不平衡(linkage disequilibrium,?D)原理的分析方法,用于檢測(cè)遺傳變異和群體樣本特征之間的聯(lián)系,挖掘與目標(biāo)性狀相關(guān)聯(lián)的遺傳位點(diǎn),為作物目標(biāo)性狀的改良提供基礎(chǔ),為分子育種提供新的研究路徑與思路[13]。雖然GWAS在茶樹(shù)多表型性狀、茶樹(shù)育種、茶葉品質(zhì)成分和茶葉飲用等方面取得了一些研究進(jìn)展,但遠(yuǎn)滯后于玉米、大豆、水稻等常見(jiàn)作物。本文介紹了影響全基因組分析結(jié)果的主要因素,總結(jié)了GWAS 在茶葉飲料消費(fèi)、茶樹(shù)重要農(nóng)藝性狀、茶葉品質(zhì)和茶樹(shù)群體結(jié)構(gòu)研究中取得的一系列進(jìn)展,以期為茶樹(shù)遺傳育種研究中利用GWAS提供理論依據(jù)。
雖然GWAS 在人類(lèi)、動(dòng)物和植物中已經(jīng)被廣泛應(yīng)用,但是仍然有許多因素限制著GWAS 的發(fā)展。GWAS 研究檢測(cè)到的關(guān)聯(lián)位點(diǎn)一般很少,而且關(guān)聯(lián)的位點(diǎn)僅能解釋很少一部分性狀變異。而未能檢測(cè)到的遺傳關(guān)聯(lián)位點(diǎn)占有很大一部分比例[14],丟失的部分遺傳變異位點(diǎn)主要由以下3個(gè)因素導(dǎo)致。
1)結(jié)構(gòu)變異。一般情況下,復(fù)雜性狀的差異不是由一個(gè)位點(diǎn)的遺傳變異引起,還可能受到結(jié)構(gòu)變異的影響,如拷貝數(shù)變異(copy number variations,CNV)[15]。最初統(tǒng)計(jì)方法的不完備和粗糙的基因分型方法等條件限制了GWAS 研究,在許多GWAS 研究中忽略了結(jié)構(gòu)變異的功能。隨著GWAS研究的不斷發(fā)展和傳播,眾多GWAS 研究開(kāi)始關(guān)注拷貝數(shù)引起的變異。但是,研究主要集中在人類(lèi)和動(dòng)物研究中的CNV 與性狀關(guān)聯(lián)性。但是,除水稻、玉米等模式植物中關(guān)于CNV 的研究較多,有關(guān)CNV 對(duì)植物性狀變異的研究報(bào)道比較少。
2)上位效應(yīng)和環(huán)境效應(yīng)。據(jù)統(tǒng)計(jì),大多數(shù)GWAS 研究沒(méi)有關(guān)注不同遺傳變異位點(diǎn)之間的相互作用以及遺傳位點(diǎn)和環(huán)境之間的相互作用[16]。Zuk等[17]認(rèn)為不同基因之間的互作是造成關(guān)聯(lián)位點(diǎn)丟失的一個(gè)重要原因。隨著對(duì)GWAS 研究的不斷深入,Wei 等[18]提出了鑒定上位基因間互作的方法。但是,要通過(guò)幾百萬(wàn)甚至是上億次的顯著性檢驗(yàn)鑒定關(guān)聯(lián)位點(diǎn),對(duì)統(tǒng)計(jì)方法和計(jì)算機(jī)計(jì)算能力的選擇甚為重要。目前,研究GWAS 遺傳變異位點(diǎn)的上位基因間的互作方法通常分為分為兩步。首先,基于全基因組水平運(yùn)用一種全局搜索方法對(duì)成對(duì)的互作基因進(jìn)行快速搜索,結(jié)果為成對(duì)基因的1個(gè)子集;然后,鑒定子集內(nèi)標(biāo)記遺傳位點(diǎn)之間的互作關(guān)系,最終得到具有顯著性的互作位點(diǎn)[18]。
復(fù)雜性狀不僅受到基因位點(diǎn)之間互作的影響同時(shí)也會(huì)受到不同環(huán)境條件的影響,在GWAS 研究中未能通過(guò)遺傳相關(guān)性解釋的關(guān)聯(lián)位性點(diǎn)可能是由于沒(méi)有考慮基因和環(huán)境之間的互作。因此,需要結(jié)合樣本大小、試驗(yàn)設(shè)計(jì)和基因型等眾多因素來(lái)考慮基因與環(huán)境之間的互作對(duì)于GWAS 研究的影響。在GWAS 的相關(guān)研究中,雖然已經(jīng)提出有關(guān)研究基因與環(huán)境之間互作的研究方法和實(shí)驗(yàn)方案,并取得一定的成果[19],但是,已提出的基于上位效應(yīng)和環(huán)境效應(yīng)背景下的研究方法并不能很好地解決關(guān)聯(lián)性位點(diǎn)丟失的問(wèn)題,也無(wú)法有效地估計(jì)關(guān)聯(lián)位點(diǎn)的P值[20]。因此,未來(lái)需要進(jìn)一步研究解決GWAS 中出現(xiàn)基因之間和基因與環(huán)境之間互作丟失關(guān)聯(lián)性位點(diǎn)的問(wèn)題。
3)稀有等位頻率。GWAS 鑒定關(guān)聯(lián)性位點(diǎn)是以等位基因頻率(allel frequency)為基礎(chǔ),低頻率的等位基因遺傳變異對(duì)研究群體的影響較小,但還有部分低頻率的等位基因?qū)π誀钣泻艽蟮挠绊懀?1]。目前,與變異顯著相關(guān)的遺傳變異位點(diǎn)容易被識(shí)別,但是這些位點(diǎn)僅與少量表型性狀相關(guān)聯(lián)。然而,從遺傳學(xué)和進(jìn)化學(xué)的角度來(lái)看,絕大多數(shù)等位基因突變都是低頻的,控制復(fù)雜性狀的遺傳變異關(guān)聯(lián)位點(diǎn)一般也是低頻的,即稀有變異(rare variant)[22]。相關(guān)研究得出了稀有變異與復(fù)雜性狀之間的關(guān)聯(lián)[23],也提出了鑒定稀有變異的研究方法[24]。
QT?和GWAS 都是基于群體的遺傳圖譜來(lái)研究群體間個(gè)體的復(fù)雜性狀,二者有許多異同點(diǎn)。數(shù)量性狀位點(diǎn)(QT?)定位的連鎖分析是GWAS 等關(guān)聯(lián)研究的直接先驅(qū),這就意味著GWAS比QT?研究結(jié)果更為精確。連鎖圖譜不是將個(gè)體組合成一個(gè)不同的GWAS 面板,而是研究具有已知關(guān)系的個(gè)體[25]。例如,對(duì)作物的連鎖定位分析通常是使用雙親本雜交產(chǎn)生的后代,無(wú)論是F2個(gè)體還是重組自交系(RI?s)。由于QT?研究的個(gè)體在家系中親緣關(guān)系較近,發(fā)生的重組較少,因此,存在較大的連鎖塊,意味著所使用的遺傳標(biāo)記不必像GWAS中使用的遺傳標(biāo)記那樣密集,以確保檢測(cè)到含有研究位點(diǎn)的基因組區(qū)域,同時(shí)也意味著QT?對(duì)群體選擇要比GWAS 苛刻。一旦發(fā)現(xiàn)并驗(yàn)證了一個(gè)QT?,該區(qū)域就可以被用于精細(xì)定位和QT?克隆。在下一代測(cè)序技術(shù)出現(xiàn)之前,這是1 個(gè)相當(dāng)大的優(yōu)勢(shì)。1988 年,在番茄中進(jìn)行了第1 次全基因組QT?分析[26],比第1個(gè)GWAS發(fā)表早了14 a。發(fā)展到今天,連鎖分析和GWAS互補(bǔ),可以用來(lái)解析不同群體中的復(fù)雜性狀。
盡管連鎖分析是解析復(fù)雜性狀的主要方法,但關(guān)聯(lián)研究的潛在價(jià)值也受到了重視。與連鎖分析相比,關(guān)聯(lián)分析的優(yōu)勢(shì)包括不需要進(jìn)行雜交實(shí)驗(yàn)[27],增加了檢測(cè)效應(yīng)較小基因的能力,并提高較小?D 塊的分辨率。然而,對(duì)高密度基因型的需求,意味著在三代測(cè)序發(fā)展之前進(jìn)行的第1 個(gè)關(guān)聯(lián)研究只能關(guān)注于基因組的小子集,只能研究已經(jīng)被其他方法確定的區(qū)域。例如,1 項(xiàng)關(guān)于玉米株高和開(kāi)花時(shí)間的早期關(guān)聯(lián)研究集中在之前研究已經(jīng)確定的候選基因dwarf8上,檢測(cè)到dwarf8及其附近的123 個(gè)多態(tài)性位點(diǎn)以及141 個(gè)全基因組標(biāo)記[28]。但是,隨著測(cè)序技術(shù)的進(jìn)步,全基因組序列的公布顯著加快了GWAS 的研究進(jìn)程。
GWAS 一個(gè)明顯的缺陷是會(huì)出現(xiàn)較高的假陽(yáng)性,即把不與性狀相關(guān)聯(lián)的位點(diǎn)劃分到關(guān)聯(lián)位點(diǎn)內(nèi),使結(jié)果中包含有與研究目的不相關(guān)的位點(diǎn)。群體結(jié)構(gòu)和個(gè)體間的親緣關(guān)系都會(huì)導(dǎo)致高假陽(yáng)性率,降低假陽(yáng)性的方法包括調(diào)整多重測(cè)試校正的限制錯(cuò)誤發(fā)現(xiàn)率、調(diào)整每個(gè)標(biāo)記的P值以及使用合適的結(jié)構(gòu)化關(guān)聯(lián)方法[29]。通用線性模型(generalized linear model,G?M)和混合線性模型(mixed linear model,M?M)是最基礎(chǔ)的結(jié)構(gòu)化關(guān)聯(lián)方法,混合線性模型可以通過(guò)親緣關(guān)系和群體結(jié)構(gòu)分析的結(jié)果減少假陽(yáng)性。為了提高混合線性模型的運(yùn)算速率,研究者開(kāi)發(fā)了混合模型關(guān)聯(lián)(EMMA)、分解譜變換線性混合模型(factored spectrally transformed linear mixed models,
FaST?MM)、全基因組高效混合模型分析(genomewide efficient mixed model association,GEMMA)、壓縮混合線性模型(compressed mixed linear model,CM?M)和富集壓縮混合線性模型(enriched compressed mixed linear model,ECM?M)。雖然上述混合線性模型提高了M?M 的運(yùn)行速度,但是增加了運(yùn)行的負(fù)荷,同時(shí)也可能增加結(jié)果的假陰性,所以要根據(jù)實(shí)際情況選擇低假陽(yáng)性、低假陰性和高運(yùn)算速度的最佳模型[30-31]。
茶作為三大無(wú)酒精飲料之一,具有良好的養(yǎng)生保健功能,其飲用價(jià)值一直是研究的熱點(diǎn)。對(duì)于茶葉消費(fèi)習(xí)慣的GWAS研究是社會(huì)學(xué)研究的熱點(diǎn)。雖然有較多關(guān)于茶葉消費(fèi)習(xí)慣的GWAS 研究,但是并沒(méi)有鑒定出與茶葉飲用習(xí)慣相關(guān)的遺傳位點(diǎn)。Taylor 等[32]、Cornelis[33]和Zhong 等[34]都對(duì)酒精和非酒精飲料(咖啡、茶)的消費(fèi)習(xí)慣與基因型數(shù)據(jù)進(jìn)行了GWAS 研究,雖然能夠鑒定出與酒或咖啡消費(fèi)相關(guān)聯(lián)的遺傳位點(diǎn),但是并未鑒定出與茶葉消費(fèi)習(xí)慣相關(guān)的遺傳位點(diǎn),可能是調(diào)查的人群數(shù)量過(guò)少或是人群過(guò)于集中不具有代表性。然而,仍有部分研究鑒定出與飲茶習(xí)慣相關(guān)的遺傳位點(diǎn)。例如,F(xiàn)urukawa等[35]和Matoba等[36]分別收集了12 258和165 084個(gè)日本參與者的茶葉消費(fèi)習(xí)慣和基因型數(shù)據(jù),對(duì)茶葉消費(fèi)習(xí)慣和基因型數(shù)據(jù)進(jìn)行GWAS 分析,都鑒定出12q24 這一遺傳變異位點(diǎn)與日本人群的茶葉飲用習(xí)慣相關(guān),并鑒定出調(diào)控飲茶習(xí)慣相關(guān)的基因ALDH2。另外,Cole等[37]對(duì)449 210名個(gè)體進(jìn)行問(wèn)卷調(diào)查,研究143 個(gè)顯著遺傳的飲食習(xí)慣,共鑒定出與飲食習(xí)慣相關(guān)聯(lián)的814個(gè)SNPs位點(diǎn),其中rs1453548位點(diǎn)與飲茶習(xí)慣相關(guān),并在位點(diǎn)附近鑒定出6個(gè)與飲茶相關(guān)的基因。通過(guò)GWAS鑒定出與茶葉飲用習(xí)慣相關(guān)的遺傳位點(diǎn)和調(diào)控基因,有利于加深對(duì)人類(lèi)飲茶習(xí)慣基因?qū)用娴牧私?,并能發(fā)掘出人類(lèi)基因新功能。
人類(lèi)健康問(wèn)題一直是研究者關(guān)注的重心,由于茶有其獨(dú)特的養(yǎng)身保健功能,所以也一直成為醫(yī)藥和營(yíng)養(yǎng)研究關(guān)注的熱點(diǎn)。Malik 等[38]研究性別、吸煙、飲用鹽茶與食管癌之間的全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)與食管癌相關(guān)的遺傳變異位點(diǎn),鑒定出P?CE1(rs2274223、rs7922612 和rs3765524 位點(diǎn))基因型與吸煙和鹽茶攝入以及患食管癌(EC)風(fēng)險(xiǎn)之間的關(guān)聯(lián)。這些飲用鹽茶與食管癌的關(guān)聯(lián)位點(diǎn)和調(diào)控基因,為醫(yī)學(xué)上研究飲用鹽茶和食管癌之間的關(guān)系提供了基因?qū)用娴淖C據(jù),并為進(jìn)一步了解飲茶和疾病之間的關(guān)系提供了新的研究方向。
1)GWAS 在茶樹(shù)樹(shù)型和葉片表型研究中的應(yīng)用。茶樹(shù)主要生長(zhǎng)在熱帶、亞熱帶,不同地區(qū)、不同品種的茶樹(shù)樹(shù)型和葉片表型差異很大,即使是生長(zhǎng)在同一地區(qū)的不同茶樹(shù)品種的葉片表型差異也較大。茶樹(shù)的樹(shù)型主要分為灌木、小喬木和喬木,樹(shù)姿主要分為直立、半開(kāi)張和開(kāi)張,不同地區(qū)、不同品種的茶樹(shù)樹(shù)型和樹(shù)姿有明顯的差異,因此,樹(shù)型和樹(shù)姿可作為茶樹(shù)分類(lèi)和品種選育的重要依據(jù)。?u 等[39]測(cè)定了云貴高原古茶樹(shù)的表型和遺傳數(shù)據(jù),將茶樹(shù)樹(shù)型、葉形、葉色、葉身等表型數(shù)據(jù)與遺傳數(shù)據(jù)進(jìn)行全基因組關(guān)聯(lián)分析,揭示了云貴高原古茶樹(shù)的多樣性和進(jìn)化、馴化機(jī)制,系統(tǒng)進(jìn)化分析結(jié)果與主成分分析(PCA)結(jié)果一致,將120 株古茶樹(shù)主要分為3 類(lèi)和5 個(gè)單分支;遺傳結(jié)構(gòu)分析進(jìn)一步將古茶樹(shù)分為7 個(gè)亞群;研究發(fā)現(xiàn),由于外部自然環(huán)境或人工育種的壓力,古茶樹(shù)的變異(非同義/同義=1.05)并沒(méi)有減少;最后,通過(guò)整合GWAS、選擇信號(hào)和基因功能預(yù)測(cè)結(jié)果,鑒定出4 個(gè)候選基因與3 個(gè)葉片性狀顯著相關(guān),2個(gè)候選基因與植物株型顯著相關(guān),這些候選基因未來(lái)可用于茶樹(shù)的功能鑒定和遺傳改良。
茶樹(shù)葉片不僅是重要的營(yíng)養(yǎng)器官也是茶葉產(chǎn)品的原材料,具有重要的經(jīng)濟(jì)價(jià)值。茶葉面積的大小對(duì)茶葉產(chǎn)量具有重要影響,以黑茶、烏龍茶、紅茶以及抹茶尤為突出[40]。根據(jù)茶葉葉面積的大小將茶樹(shù)分為大葉種和小葉種,茶葉葉面積大小與茶樹(shù)樹(shù)型和地理分布密切相關(guān)。目前,對(duì)于調(diào)控葉面積的關(guān)鍵基因和遺傳機(jī)制的研究相對(duì)較少。Tan 等[41]以‘龍井43’和‘白毫早’作為親本,對(duì)其170個(gè)后代構(gòu)建了基于SSR 標(biāo)記的連鎖圖譜,對(duì)成熟茶葉葉面積進(jìn)行了初步QT?定位,鑒定出1 個(gè)與茶葉面積顯著相關(guān)的QT?位點(diǎn);但是與SNPs 連鎖圖譜相比,構(gòu)建的連鎖圖譜準(zhǔn)確性較低。An 等[40]以‘金萱’和‘云茶1號(hào)’作為親本,對(duì)其96 個(gè)后代進(jìn)行重測(cè)序,構(gòu)建了1個(gè)包含15 個(gè)連鎖群的高密度遺傳圖譜,其中包括8 956 個(gè)高質(zhì)量SNPs,共鑒定出25 個(gè)與葉面積相關(guān)的代表性標(biāo)記(潛在的QT?)和2 個(gè)與茶樹(shù)葉面積相關(guān)的SNP,這些數(shù)據(jù)和圖譜將為進(jìn)一步研究茶樹(shù)性狀分離、功能基因定位和標(biāo)記輔助育種提供強(qiáng)有力的支持。
茶葉葉片形狀具有較強(qiáng)的遺傳多樣性,不同品種的茶樹(shù)葉片形狀差異大,即使是同一品種的茶樹(shù)其葉片形狀也會(huì)有所不同。茶葉葉片特性是決定茶葉品質(zhì)的重要因素,是育種選擇的重要指標(biāo)。Zhang等[42]對(duì)貴州黔南都勻毛尖8 個(gè)產(chǎn)區(qū)中的123 株茶樹(shù)進(jìn)行特定位點(diǎn)擴(kuò)增片段(the specific-locus amplified fragment,S?AF)測(cè)序,將測(cè)序數(shù)據(jù)與茶樹(shù)葉尖和葉形等表型數(shù)據(jù)進(jìn)行全基因組關(guān)聯(lián)分析,結(jié)果表明,群體結(jié)構(gòu)分析將123 株茶樹(shù)劃分為3 個(gè)群體,關(guān)聯(lián)分析共鑒定出11 個(gè)與葉尖相關(guān)的候選基因和7 個(gè)與葉片形狀相關(guān)的候選基因。這些候選基因更新了對(duì)于茶樹(shù)葉片表型調(diào)控基因的認(rèn)識(shí),未來(lái)可用于茶樹(shù)葉片表型的分子生物學(xué)研究和茶樹(shù)遺傳育種研究。
2)GWAS 在茶樹(shù)春芽萌發(fā)時(shí)間研究中的應(yīng)用。茶樹(shù)春梢是茶葉生產(chǎn)加工的直接原材料,葉片是進(jìn)行光合作用制造有機(jī)營(yíng)養(yǎng)物質(zhì)的器官,其著生于新梢[43],充分了解新梢生長(zhǎng)發(fā)育的特點(diǎn),對(duì)于茶樹(shù)生長(zhǎng)規(guī)律的深入了解具有極其重要的意義。尤其是對(duì)于早春溫度相對(duì)較低的地區(qū),早春芽萌發(fā)(spring bud flush,TBF)的茶樹(shù)在第一輪收獲中可以避免一些病蟲(chóng)害發(fā)生,并積累大量的有機(jī)天然化合物,確保茶的最佳品質(zhì),因此,了解茶樹(shù)春芽萌發(fā)時(shí)間的遺傳背景和多樣性對(duì)于選育早春芽萌發(fā)的茶樹(shù)良種具有重要意義。Wang 等[44]以151 個(gè)茶樹(shù)種質(zhì)資源為研究對(duì)象,利用確定位點(diǎn)擴(kuò)增片段測(cè)序(specific-locus amplified fragment sequencing,S?AF-seq)進(jìn)行GWAS 分析,鑒定大量的SNP 變異位點(diǎn)以及與茶樹(shù)TBF 相關(guān)的候選基因。3 a 中GWAS 分析檢測(cè)到26 個(gè)與TBF相關(guān)的SNP,最終確定了1 個(gè)與茶樹(shù)TBF 顯著相關(guān)的SNP 位點(diǎn)。為了鑒定可能與TBF 相關(guān)的候選基因,在與TBF 密切相關(guān)的SNP 位點(diǎn)100 kb 區(qū)域范圍內(nèi)篩選了7 個(gè)候選基因。此外,還在SNP 位點(diǎn)中發(fā)現(xiàn)了有利的等位基因變異的“TT”基因型,設(shè)計(jì)了與TBF 共分離的裂切擴(kuò)增多態(tài)性(derived cleaved amplified polymorphism,dCAPS)標(biāo)記,此標(biāo)記可用于茶樹(shù)標(biāo)記輔助選擇育種。鑒定出的7 個(gè)候選基因與調(diào)控春芽萌發(fā)密切相關(guān),將為之后春芽萌發(fā)的調(diào)控機(jī)制研究奠定基礎(chǔ)。
茶葉品質(zhì)一直是茶葉研究的重點(diǎn)。茶葉的品質(zhì)由茶葉中多種生化成分共同決定,其中對(duì)茶葉品質(zhì)影響顯著的主要是次生代謝物,如兒茶素、茶多酚和咖啡堿等。Yamashita 等[45]評(píng)估了基因組預(yù)測(cè)(genomic prediction,GPs)和GWAS 對(duì)茶品質(zhì)相關(guān)代謝物遺傳育種的潛力,使用SNP 檢測(cè)來(lái)自150 個(gè)茶樹(shù)種質(zhì)的DNA 測(cè)序結(jié)果的限制性相關(guān)位點(diǎn)。GP 有效地預(yù)測(cè)了與EC、ECG、EGCG、總兒茶素和咖啡堿含量相關(guān)的遺傳位點(diǎn),但沒(méi)有預(yù)測(cè)到與游離氨基酸(FAAs)含量相關(guān)的位點(diǎn)。采用genomic best linear unbiased prediction(GB?UP)with linear ridge kernel regression(RR)或GB?UP with non-linear Gaussian kernel regression(GAUSS)、Ridge、?asso、Elastic Net和隨機(jī)森林模型等6 種分析模型對(duì)GP 進(jìn)行評(píng)估,結(jié)果顯示這些預(yù)測(cè)值是穩(wěn)定的。此外,通過(guò)GWAS 和GP 的綜合分析可以鑒定與預(yù)測(cè)代謝物相關(guān)的潛在候選基因,在150 份材料中,每個(gè)代謝物通過(guò)GWAS分析鑒定出80~160 個(gè)SNPs,最終鑒定到13 個(gè)與EGCG 和咖啡堿含量相關(guān)的常見(jiàn)候選基因。這些候選基因?yàn)檠芯坎枞~品質(zhì)成分相關(guān)的基因奠定了基礎(chǔ),有利于培育出高品質(zhì)的茶樹(shù)新品種。
目前很少同時(shí)將茶樹(shù)表型性狀、茶葉品質(zhì)成分與茶樹(shù)進(jìn)行全基因組關(guān)聯(lián)分析,但Hazra 等[46]將23株大吉嶺茶樹(shù)種質(zhì)與農(nóng)藝性狀和風(fēng)味相關(guān)成分進(jìn)行全基因組關(guān)聯(lián)分析,最終檢測(cè)到57 個(gè)SNPs 標(biāo)記位點(diǎn),其中12 個(gè)SNPs 與表沒(méi)食子兒茶素沒(méi)食子酸酯(EGCG)密切相關(guān),8 個(gè)SNPs 與茶葉風(fēng)味密切相關(guān),3 個(gè)SNPs 與酚類(lèi)物質(zhì)密切相關(guān),8 個(gè)SNPs 與活性氧清除密切相關(guān),6 個(gè)SNPs 與氣孔指數(shù)密切相關(guān),5 個(gè)SNPs 與單寧密切相關(guān),7 個(gè)SNPs 與產(chǎn)量密切相關(guān)。這些SNPs 位點(diǎn)的鑒定為茶樹(shù)表型性狀和品質(zhì)調(diào)控相關(guān)研究奠定了基礎(chǔ),有利于推動(dòng)茶樹(shù)分子育種的發(fā)展。
由于茶氨酸、咖啡堿和兒茶素對(duì)茶品質(zhì)及其生理功能有重要影響,其合成和調(diào)控相關(guān)基因的鑒定對(duì)于了解茶葉品質(zhì)成分的合成和調(diào)控途徑、培育高品質(zhì)的茶樹(shù)具有重要意義。Fang 等[47]對(duì)289 株茶樹(shù)在3 個(gè)季節(jié)的茶氨酸、咖啡堿、兒茶素進(jìn)行全基因組關(guān)聯(lián)分析,基于SNP 數(shù)據(jù)將茶樹(shù)分為2 個(gè)群體,群體1(191 株)鑒定到307 個(gè)與茶氨酸、咖啡堿、兒茶素相關(guān)的SNP 標(biāo)記,通過(guò)群體2(98 株)驗(yàn)證候選的30個(gè)SNP 標(biāo)記,其中有17 個(gè)與特定的次生代謝物顯著或極顯著相關(guān),這些標(biāo)記位點(diǎn)的確定將為茶葉風(fēng)味相關(guān)代謝物的研究提供基礎(chǔ),并有助于加快茶樹(shù)新品種的培育。
游離氨基酸(尤其是茶氨酸)是茶葉中最主要的化學(xué)成分之一,有助于提高茶的口感、功能和質(zhì)量。人工雜交能夠有效選育出高氨基酸含量且綜合性狀優(yōu)良的茶樹(shù)新種質(zhì)。Huang 等[48]以‘龍井43’和‘白雞冠’作為親本,基于簡(jiǎn)化基因組測(cè)序(genotypingby-sequencing,GBS)技術(shù)對(duì)其198 個(gè)雜交F1植株的游離氨基酸含量進(jìn)行GWAS分析,發(fā)掘出2 688個(gè)多態(tài)性SNP 標(biāo)記,構(gòu)建了具有15 個(gè)連鎖群(linkage groups,?Gs)的高密度圖譜,共鑒定出4 個(gè)與游離氨基酸(茶氨酸、谷氨酸、谷氨酰胺、天冬氨酸和精氨酸)含量相關(guān)的QT?,分別定位到?G03、?G06、?G11 和?G14。該研究對(duì)于闡明茶樹(shù)優(yōu)異種質(zhì)資源高氨基酸性狀的遺傳機(jī)制以及優(yōu)質(zhì)茶樹(shù)品種選育和改善茶葉品質(zhì)具有重要意義。
傳統(tǒng)的基于表型評(píng)價(jià)的育種方法存在茶樹(shù)世代長(zhǎng)、表型測(cè)量準(zhǔn)確性差,無(wú)法在茶樹(shù)達(dá)到生理成熟之前對(duì)茶葉品質(zhì)和產(chǎn)量進(jìn)行評(píng)估等問(wèn)題。然而,傳統(tǒng)的茶樹(shù)育種方法仍處于主導(dǎo)地位[49]??焖偾腋咝У挠N方法對(duì)于推動(dòng)茶產(chǎn)業(yè)的發(fā)展和滿足茶葉市場(chǎng)的需求具有重要意義?;蚪M學(xué)的發(fā)展能夠推動(dòng)植物育種進(jìn)程,提高植物的育種效率,如分子標(biāo)記輔助育種技術(shù)能夠提高植物的育種效率,縮短木本植物的育種進(jìn)程。從育種群體的種子或幼苗中獲得的基因型數(shù)據(jù)可用于預(yù)測(cè)成熟個(gè)體的表型性狀,而不需要在不同的年份和環(huán)境中進(jìn)行廣泛的表型評(píng)估。由于茶樹(shù)中的大多數(shù)性狀都是復(fù)雜性狀,目前有關(guān)茶樹(shù)GWAS 研究檢測(cè)到的基因位點(diǎn)只能解釋一小部分表型變異(遠(yuǎn)小于性狀的遺傳力),所以未來(lái)需要對(duì)茶樹(shù)復(fù)雜性狀進(jìn)行更深入的GWAS 研究,盡可能減少由于上位效應(yīng)和環(huán)境效應(yīng)造成遺傳位點(diǎn)丟失的現(xiàn)象發(fā)生,從而能夠檢測(cè)到更為有效的基因位點(diǎn)。
成功的GWAS需要來(lái)自群體的全面而又準(zhǔn)確的基因組和表型數(shù)據(jù)。雖然有多種高通量DNA 測(cè)序方法可用于生成基因組數(shù)據(jù),但生成高質(zhì)量表型數(shù)據(jù)的技術(shù)卻遠(yuǎn)遠(yuǎn)落后于基因組測(cè)序技術(shù)。傳統(tǒng)的植物表型測(cè)量方法大多依賴(lài)于人工,具有費(fèi)力、耗時(shí)及不準(zhǔn)確等缺點(diǎn),不利于從群體中快速而準(zhǔn)確地獲取表型數(shù)據(jù)。高通量表型技術(shù)克服了傳統(tǒng)方法的上述缺點(diǎn),已成為評(píng)價(jià)植物表型的有力工具[50]。高通量表型技術(shù),如可見(jiàn)光成像、高光譜成像和熒光成像,已成功應(yīng)用于評(píng)估植物生長(zhǎng)、生物量和營(yíng)養(yǎng)狀況,主要用于測(cè)量細(xì)胞、種子、芽、葉、根、單個(gè)植物和冠層等植物表型[51-52]。高質(zhì)量表型數(shù)據(jù)測(cè)量技術(shù)已經(jīng)廣泛運(yùn)用在水稻、玉米、小麥、大豆等農(nóng)作物上,其表型主要包括株高、粒形、芽長(zhǎng)、分蘗數(shù)等植物常見(jiàn)表型和植物病害等非生物脅迫[53-54]。茶樹(shù)葉身、葉面、葉緣、葉鋸齒等表型數(shù)據(jù)和病蟲(chóng)害測(cè)量需要克服人工測(cè)量精準(zhǔn)度差、主觀意識(shí)強(qiáng)等缺陷。所以未來(lái)對(duì)茶樹(shù)表型數(shù)據(jù)的測(cè)量可以應(yīng)用高通量表型測(cè)量技術(shù)檢測(cè)出更多、更有效的與茶樹(shù)表型調(diào)控相關(guān)的遺傳位點(diǎn)和基因。
生物/非生物脅迫是影響植物產(chǎn)量、品質(zhì)和生長(zhǎng)發(fā)育的主要因素,水稻、玉米、小麥等禾本科植物和梨、桃、蘋(píng)果、茶樹(shù)等木本植物都將生物/非生物脅迫作為研究的熱點(diǎn)。基于病蟲(chóng)害的GWAS最初是在擬南芥、水稻、小麥等模式作物中開(kāi)展,因木本植物基因組問(wèn)世比較晚,木本植物的GWAS 也進(jìn)展緩慢。隨著木本植物基因組的公布,對(duì)木本植物基于生物/非生物脅迫的GWAS 也在不斷發(fā)展,如在蘋(píng)果、梨、橙子和杏等木本植物中開(kāi)展了基于蘋(píng)果斑枯病、白粉病、病原菌抗性和低溫脅迫等的GWAS[55-56],鑒定出一系列與植物抗性相關(guān)的基因,有利于今后選育抗性強(qiáng)的優(yōu)良品種。目前,幾乎沒(méi)有關(guān)于茶樹(shù)抗性鑒定的GWAS 研究,比較茶樹(shù)在不同脅迫下的抗性指標(biāo)及不同茶樹(shù)品種在脅迫下抗逆性指標(biāo)變化的差異仍是茶樹(shù)抗性鑒定的重要手段?;谌蚪M的QT?和SNP 關(guān)聯(lián)作圖,可同時(shí)對(duì)多個(gè)等位基因進(jìn)行標(biāo)記分析,能夠準(zhǔn)確鑒定出與表型和抗性性狀相關(guān)的許多遺傳變異位點(diǎn)和目的基因,發(fā)現(xiàn)參與抗性調(diào)控的新遺傳變異位點(diǎn)和新基因。總的來(lái)說(shuō),由于GWAS 能夠?yàn)椴铇?shù)育種提供分子標(biāo)記,可以加快茶樹(shù)抗性基因鑒定的研究進(jìn)程,并最終提高茶樹(shù)抗性品種的育種效率,基于茶樹(shù)抗性的GWAS 將會(huì)逐漸成為茶樹(shù)育種研究的熱點(diǎn)。
一般來(lái)說(shuō),表型性狀的變異有限,而大量代謝物的含量存在巨大的差異。GWAS 鑒定的作物表型性狀QT?往往具有中或低等效應(yīng)[57],部分原因可能是基于目標(biāo)表型的有限變異。調(diào)控代謝物積累的遺傳變異更容易與全基因組進(jìn)行關(guān)聯(lián)分析,mGWAS(metabolome-based genome-wide association study)在水稻、玉米、番茄等作物中已經(jīng)被廣泛使用,鑒定出與獨(dú)角金內(nèi)酯、類(lèi)黃酮等代謝物相關(guān)的調(diào)控基因[23,58-59]。此外,結(jié)合轉(zhuǎn)錄組、代謝組和基因組的多組學(xué)關(guān)聯(lián)分析已經(jīng)在擬南芥、番茄等植物中普遍應(yīng)用,鑒定出與植物非生物脅迫和調(diào)控類(lèi)黃酮合成相關(guān)的基因[59-60]。茶樹(shù)多組學(xué)GWAS將會(huì)成為今后研究的熱點(diǎn)。
華中農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)2022年5期