王小萍,王 云,熊元元,劉 曉,李明紅,張 廳,賴(lài) 謙,李春華
(1.四川省農(nóng)業(yè)科學(xué)院茶葉研究所,成都 610066;2.瀘州市經(jīng)濟(jì)作物站,四川 瀘州 646000;3.古藺縣農(nóng)業(yè)農(nóng)村局,四川 瀘州 646500)
【研究意義】茶樹(shù)葉型與茶樹(shù)抗性強(qiáng)弱、產(chǎn)量和品質(zhì)密切相關(guān)。葉長(zhǎng)、葉寬、長(zhǎng)寬比、葉身、葉色等是茶樹(shù)重要的葉型性狀,易受環(huán)境和遺傳等多因素的共同影響,屬于典型的數(shù)量性狀[1]。研究茶樹(shù)葉型性狀的遺傳特性,選育具有合理葉型性狀的新品種,對(duì)促進(jìn)茶樹(shù)高效優(yōu)質(zhì)育種具有積極意義?!厩叭搜芯窟M(jìn)展】關(guān)聯(lián)分析技術(shù)可直接對(duì)基因型變異和表型變異進(jìn)行分析,從而發(fā)掘特定條件下與性狀相關(guān)聯(lián)的候選基因[2]。隨著基因組測(cè)序技術(shù)的快速發(fā)展,全基因組關(guān)聯(lián)分析(GWAS)已在玉米[3-4]、水稻[5-6]、小麥[7]、油菜[8]、甜瓜等[9]的相關(guān)性狀研究和基因發(fā)掘中得到廣泛應(yīng)用,而在茶樹(shù)上的應(yīng)用起步晚且較少。 Lu等[10]利用全基因組關(guān)聯(lián)分析對(duì)來(lái)自貴州、云南的8個(gè)古茶樹(shù)群體進(jìn)行遺傳結(jié)構(gòu)及樹(shù)型與葉型相關(guān)性狀進(jìn)行分析,挖掘出6個(gè)候選基因,與4個(gè)葉型性狀和2個(gè)樹(shù)型性狀顯著相關(guān)。Hazra等[11]利用全基因組關(guān)聯(lián)技術(shù)對(duì)23份大吉嶺茶樹(shù)種質(zhì)的農(nóng)藝與品質(zhì)性狀進(jìn)行研究,最終檢測(cè)到57個(gè)SNP顯著位點(diǎn),多與茶樹(shù)品質(zhì)性狀相關(guān)聯(lián)。Huang等[12]對(duì)“龍井43”“白雞冠”的198份F1代植株開(kāi)展游離氨基酸含量的關(guān)聯(lián)分析,挖掘出4個(gè)關(guān)聯(lián)候選基因。【本研究切入點(diǎn)】雖然前人基于茶樹(shù)葉型性狀研究發(fā)掘出部分候選基因,但茶樹(shù)葉型受多基因控制與影響,有必要發(fā)掘更多的關(guān)聯(lián)位點(diǎn)和候選基因輔助分子標(biāo)記育種。【擬解決的關(guān)鍵問(wèn)題】對(duì)收集于四川本地的91份茶樹(shù)自然群體開(kāi)展簡(jiǎn)化基因組測(cè)序,基于測(cè)序獲得的SNP開(kāi)展葉型性狀的全基因組關(guān)聯(lián)分析,篩選與葉型性狀關(guān)聯(lián)的SNP位點(diǎn),并挖掘相關(guān)的候選基因,為今后茶樹(shù)分子標(biāo)記輔助育種提供基因資源和參考依據(jù)。
91份茶樹(shù)資源(表1)包括70份野生喬木型茶樹(shù)資源[古藺52份(以G1,G2......表示)、敘永5份(以X1,X2......表示)、合江1份(以H1表示)、雷波4份(以LB1,LB2......表示)、崇州6份(以CP1,CP2......表示)、云南大葉種2份(以YD1、YD2表示)],8份北川野生茶樹(shù)(以BC1,BC2......表示)和13份四川中小葉群體種材料(以CCXX表示,CC表示川茶首字母,XX表示具體來(lái)源地首字母,如CCJA表示源自江安縣的四川中小葉群體種,GYGC表示“高陽(yáng)貢茶”)。
表1 91份茶樹(shù)資源
續(xù)表1 Continued table 1
根據(jù)《茶樹(shù)種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)》于2020年10—11月調(diào)查并測(cè)量茶樹(shù)的葉長(zhǎng)(YC)、葉寬(YK)、長(zhǎng)寬比(CKB)、葉身(YS)、葉色(YSZ)、葉尖(YD)、葉脈對(duì)數(shù)(YM)和葉緣(YY)共8個(gè)性狀。其中葉身(YS)、葉色(YSZ)、葉尖(YD)和葉緣(YY)4個(gè)描述型性狀參照《茶樹(shù)種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)》轉(zhuǎn)化為數(shù)值數(shù)據(jù),使用Excel整理調(diào)查統(tǒng)計(jì)的數(shù)據(jù),并利用R軟件(V3.5.0)對(duì)表型數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,計(jì)算均值、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、偏度、峰度等。
于2021年5—6月取參試資源夏梢幼的嫩芽葉,采用改良CTAB法提取基因組DNA,質(zhì)檢合格的基因組DNA由廣東基迪奧生物科技公司進(jìn)行30×的全基因組簡(jiǎn)化測(cè)序(GBS),將測(cè)序數(shù)據(jù)進(jìn)行過(guò)濾和比對(duì),獲得高質(zhì)量的SNP標(biāo)記。基于高質(zhì)量的SNP標(biāo)記,利用Admixture軟件(V1.3)[13]進(jìn)行供試材料群體結(jié)構(gòu)推斷,根據(jù)交叉驗(yàn)證錯(cuò)誤率(CV)確定群體最優(yōu)分群數(shù)(交叉驗(yàn)證錯(cuò)誤最小值對(duì)應(yīng)最優(yōu)的分群數(shù)),即K值;同時(shí)利用gcta軟件(v1.92.2)[14]進(jìn)行親緣關(guān)系分析,獲得供試材料兩兩間親緣關(guān)系矩陣。
根據(jù)最優(yōu)K值計(jì)算各材料相應(yīng)Q值,作為固定效應(yīng)協(xié)變量矩陣(Q矩陣),以親緣關(guān)系矩陣作為隨機(jī)效應(yīng)協(xié)變量矩陣(K矩陣),應(yīng)用Tassel軟件(v5.2.54)[15]的廣義線性模型(Q模型),基于SNP標(biāo)記對(duì)供試91份茶樹(shù)資源葉型8個(gè)性狀的表型數(shù)據(jù)進(jìn)行全基因組關(guān)聯(lián)分析(GWAS)。取P<0.01時(shí)與性狀顯著關(guān)聯(lián)的SNP位點(diǎn),并在顯著位點(diǎn)上下游50 kbp區(qū)域內(nèi)進(jìn)行候選基因挖掘[7]。根據(jù)候選基因GO與KEGG 注釋,進(jìn)一步推斷預(yù)測(cè)與葉型性狀關(guān)聯(lián)的功能基因。
對(duì)91份茶樹(shù)資源葉型8個(gè)性狀進(jìn)行分析(表2)顯示,8個(gè)葉型性狀均表現(xiàn)較大變異,其中葉尖的變異系數(shù)最大(47.18%),長(zhǎng)寬比變異系數(shù)最小(11.34%)。 4個(gè)數(shù)值型性狀中葉長(zhǎng)、葉寬、長(zhǎng)寬比和葉脈對(duì)數(shù)均值分別是12.44 cm、5.26 cm、2.38和8.49對(duì),波動(dòng)范圍較大。4個(gè)描述型性狀中葉身、葉色、葉尖和葉緣的均值分別是1.51、3.14、1.49和2.18,且4個(gè)性狀在所有賦值等級(jí)均有分布。8個(gè)性狀中,除性狀長(zhǎng)寬比和葉色的峰度數(shù)值較大外,其余性狀偏度、峰度接近1,基本符合正態(tài)分布。將各性狀進(jìn)行相關(guān)性分析(表3),葉長(zhǎng)與葉寬相關(guān)性最大(r=0.86),其次是葉長(zhǎng)與葉脈對(duì)數(shù)(r=0.57),分別呈顯著正相關(guān);葉長(zhǎng)與葉尖(r=-0.59)、葉寬與葉尖(r=-0.52)分別呈顯著負(fù)相關(guān);除葉緣、葉色2個(gè)性狀與其他性狀相關(guān)系數(shù)較低以外,其余兩兩性狀間均存在一定的相關(guān)性,表明這8個(gè)葉型性狀間存在協(xié)同變化的關(guān)系。
對(duì)91份茶樹(shù)資源基因組DNA進(jìn)行分析,構(gòu)建GBS文庫(kù)及酶切測(cè)序,共獲得97.79 G數(shù)據(jù),過(guò)濾后獲得95.69 G數(shù)據(jù),734 642 116條高質(zhì)量reads,平均每份茶樹(shù)資源獲得1.05 G數(shù)據(jù),8072 990條高質(zhì)量reads。91份茶樹(shù)資源Q20≥97.27%,Q30≥91.84%,表明測(cè)序質(zhì)量較好,GC含量在40.02%~41.76%,分布正常。將高質(zhì)量reads比對(duì)到茶樹(shù)參考基因組上,參試茶樹(shù)共獲得5569 787個(gè)變異,其中5374 140個(gè)SNPs,195 647個(gè)Indels。
基于篩選獲得863 468個(gè)高質(zhì)量的SNP標(biāo)記,利用Admixture軟件(V1.3)對(duì)參試茶樹(shù)資源的遺傳結(jié)構(gòu)進(jìn)行分析,當(dāng)K=2時(shí),CV值最小(圖1-A),參試茶樹(shù)資源被分為2個(gè)亞群(圖1-B)。其中亞群Ⅰ包含22份茶樹(shù)資源,分別為8份北川茶樹(shù)、11份四川中小葉群體種、2份云南茶樹(shù)和1份古藺茶樹(shù);亞群Ⅱ包含69份茶樹(shù),以古藺、敘永、崇州、合江、雷波的野生茶樹(shù)為主,同時(shí)還包含2份四川中小葉群體種茶樹(shù)。
表2 91份茶樹(shù)資源葉型相關(guān)性狀基本統(tǒng)計(jì)
表3 葉型相關(guān)性狀的相關(guān)性分析
圖1 91份茶樹(shù)資源的群體結(jié)構(gòu)分析Fig.1 Population structure analysis of 91 tea resources
進(jìn)一步利用gcta軟件(v1.92.2)對(duì)茶樹(shù)資源進(jìn)行親緣關(guān)系分析,獲得91份茶樹(shù)資源兩兩間親緣關(guān)系。由圖2可知, 38份茶樹(shù)資源(占比41.75%)兩兩材料間親緣關(guān)系小于0, 48份茶樹(shù)資源(占比52.75%)兩兩材料間親緣關(guān)系介于0~0.5,僅5份資源(占比5.49%)的兩兩材料間親緣關(guān)系介于0.5~1.5。
圖2 91份茶樹(shù)資源的親緣關(guān)系Fig.2 Kinship of 91 tea resources
基于863 468個(gè)SNP標(biāo)記對(duì)91份茶樹(shù)資源葉型8個(gè)性狀的表型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,由表4可知,在P<0.01時(shí),8個(gè)性狀中的葉長(zhǎng)(YC)、長(zhǎng)寬比(CKB)、葉色澤(YSZ)、葉尖(YD)、葉緣(YY)、葉脈(YM) 6個(gè)性狀共檢測(cè)到38個(gè)顯著SNP位點(diǎn),葉寬和葉身2個(gè)性狀未檢測(cè)到顯著SNP位點(diǎn)。38個(gè)顯著位點(diǎn)中:葉長(zhǎng)(YC)關(guān)聯(lián)到1個(gè)顯著位點(diǎn),長(zhǎng)寬比(CKB)關(guān)聯(lián)到的顯著位點(diǎn)最多,為24個(gè),葉色澤(YSZ)關(guān)聯(lián)到6個(gè)顯著位點(diǎn),葉尖(YD)關(guān)聯(lián)到2個(gè)顯著位點(diǎn),葉脈對(duì)數(shù)關(guān)聯(lián)到1個(gè)顯著位點(diǎn),葉緣則關(guān)聯(lián)到4個(gè)顯著位點(diǎn)。這些SNP顯著位點(diǎn)對(duì)關(guān)聯(lián)性狀的解釋率在31.37%~60.70%,從SNP顯著位點(diǎn)的位置信息來(lái)看,其中34個(gè)(占比89.5%)關(guān)聯(lián)位點(diǎn)位于基因間區(qū),3個(gè)(占比7.9%)關(guān)聯(lián)位點(diǎn)位于內(nèi)含子區(qū)域,1個(gè)(占比2.6%)關(guān)聯(lián)位點(diǎn)位于轉(zhuǎn)錄終止下游1 kb區(qū)域內(nèi)。
表4 基于SNP標(biāo)記的關(guān)聯(lián)分析檢測(cè)到的葉型相關(guān)性狀顯著位點(diǎn)
續(xù)表4 Continued table 4
基于參考基因組的序列數(shù)據(jù),對(duì)獲得的SNP顯著位點(diǎn)上下游50 kbp區(qū)域內(nèi)進(jìn)行掃描,共篩選出潛在的候選基因8個(gè),其中CSA011953(Sec11a真核信號(hào)肽酶s26b)、CSA027293(CAD3肉桂醇脫氫酶3)、CSA020561(GAE2udp-葡萄糖醛酸4-外酯酶3)、CSA008530(AIM1過(guò)氧化物酶體脂肪酸-氧化多功能蛋白靶向1)、CSA008531(MFP過(guò)氧化物酶體脂肪酸-氧化多功能蛋白靶向1)、CSA008532(AIM1過(guò)氧化物酶體脂肪酸-氧化多功能蛋白靶向1)與性狀長(zhǎng)寬比(CKB)相關(guān)聯(lián),CSA008763(CYP72A154細(xì)胞色素p450)與葉片色澤(YSZ)相關(guān)聯(lián),CSA029592(RABG3Fras相關(guān)蛋白rab7亞型x1)與葉脈對(duì)數(shù)(YM)相關(guān)聯(lián)(圖3)。對(duì)8個(gè)候選基因進(jìn)行GO和KEGG注釋(表5),初步推測(cè)基因CSA027293(CAD3)與長(zhǎng)寬比(CKB)緊密關(guān)聯(lián)、CSA008763(CYP72A154)與葉片色澤(YSZ)緊密關(guān)聯(lián)。
圖3 8個(gè)候選基因在性狀關(guān)聯(lián)SNP位點(diǎn)中的位置Fig.3 Location of eight candidate genes in related SNP markers
表5 8個(gè)候選基因的GO和KEGG注釋信息
本研究對(duì)茶樹(shù)成熟葉片的葉長(zhǎng)(YC)、葉寬(YK)、長(zhǎng)寬比(CKB)、葉身(YS)、葉色(YSZ)、葉尖(YD)、葉脈對(duì)數(shù)(YM)和葉緣(YY)8個(gè)性狀進(jìn)行表型分析,多樣性較高,變異系數(shù)介于11.34%~47.18%,與其他以野生自然群體茶樹(shù)為研究對(duì)象的相關(guān)研究相比(性狀相同),高于貴州姑菁野生茶樹(shù)資源的表型多樣性[16],略低于云南野生茶樹(shù)資源[17-18]。
在遺傳結(jié)構(gòu)分析中,91份茶樹(shù)資源分為2個(gè)亞群,源自2個(gè)遺傳血統(tǒng)。從茶樹(shù)資源來(lái)源看,亞群Ⅰ中四川中小葉群體種取自德昌、廣安、平武、旺蒼、宣漢、天全、江安等地,北川茶樹(shù)資源取自山林間,零星分布,當(dāng)?shù)胤Q(chēng)之為“野生茶”,云南大葉種則源自德宏州芒市當(dāng)?shù)卮笕~種群體自然雜交后代,這3個(gè)自然群體遺傳結(jié)構(gòu)一致,具有共同血統(tǒng)來(lái)源,初步印證四川中小葉群體種部分源自云南茶果,但還需進(jìn)一步擴(kuò)大樣本數(shù)量證實(shí);亞群Ⅱ中,16份茶樹(shù)資源(含14份古藺大樹(shù)茶與2份雷波大葉種)遺傳結(jié)構(gòu)一致且單一,有54份茶樹(shù)資源則存在亞群Ⅰ和亞群Ⅱ 2個(gè)血統(tǒng)雜合,表明2個(gè)亞群間存在基因滲透交流的趨勢(shì),但兩者仍然獨(dú)立且亞群Ⅱ(野生型)仍在遺傳結(jié)構(gòu)中占據(jù)主導(dǎo)。這也間接印證了鐘渭基[19]認(rèn)為四川野生大茶樹(shù)系本地原產(chǎn)的觀點(diǎn),也與周斌等[20]對(duì)雷波、云南茶樹(shù)遺傳結(jié)構(gòu)研究中,認(rèn)為四川與云南的野生茶樹(shù)群落相互獨(dú)立觀點(diǎn)一致。
葉片是茶樹(shù)重要的生長(zhǎng)器官之一,同時(shí)也是茶樹(shù)的直接利用部位。葉片形態(tài)不僅直接影響光合效率(產(chǎn)量),還與茶樹(shù)抗性強(qiáng)弱密切相關(guān)。Lu等[10]對(duì)茶樹(shù)葉型和樹(shù)型共11個(gè)性狀開(kāi)展GWAS研究中,定位發(fā)現(xiàn)2個(gè)基因TEA01277與TEA02816與茶樹(shù)葉色緊密關(guān)聯(lián),基因TEA01277屬編碼鈣調(diào)素結(jié)合轉(zhuǎn)錄激活因子2,基因TEA02816則屬cop1/spa泛素連接酶復(fù)合物。本研究中,篩選出基因CSA008763(CYP72A154)與葉色(YSZ)緊密關(guān)聯(lián)。該基因?qū)偌?xì)胞色素P450家族CYP72A亞家族,CYP72A154被證實(shí)與甘草酸合成途徑中的C-30氧化有關(guān)[21],并在野生型甘草中高度表達(dá)[22]。另外,基因CSA027293(CAD3)與長(zhǎng)寬比緊密關(guān)聯(lián)。CAD(肉桂醇脫氫酶)是木質(zhì)素單體合成最后一步還原反應(yīng)關(guān)鍵酶,目前CAD基因已在小麥[23]、茶樹(shù)[24]、楊樹(shù)[25]、陸地棉[26]、棉花[27]、黑莓[28]等物種中克隆鑒定得到。研究表明,CAD基因的表達(dá)與植株木質(zhì)素累積或木質(zhì)素單體結(jié)構(gòu)組成等有關(guān)。如在小麥[23]、高粱[29]中,CAD4基因與抗倒伏能力有關(guān),而茶樹(shù)中基因CAD3在新梢第5葉中高度表達(dá),與茶樹(shù)鮮葉的木質(zhì)化程度密切相關(guān)[24]。后續(xù)將對(duì)進(jìn)一步驗(yàn)證這2個(gè)候選基因的準(zhǔn)確性開(kāi)展研究。
基于簡(jiǎn)化基因組重測(cè)序(GBS)對(duì)四川本地的91份茶樹(shù)自然群體進(jìn)行分析,利用測(cè)序獲得的863 468個(gè)高質(zhì)量的SNP標(biāo)記對(duì)葉型8個(gè)性狀(葉長(zhǎng)、葉寬、長(zhǎng)寬比、葉身、葉色、葉尖、葉脈對(duì)數(shù)和葉緣)開(kāi)展全基因組關(guān)聯(lián)分析,獲得38個(gè)顯著SNP關(guān)聯(lián)位點(diǎn),并初步推測(cè)基因CSA008763(CYP72A154)與葉色、基因CSA027293(CAD3)與長(zhǎng)寬比緊密關(guān)聯(lián),這為今后茶樹(shù)分子標(biāo)記輔助育種提供基因資源和理論參考。