梁燕妮, 黃銀霞, 魏詩(shī)琴, 陳秋雨
(梧州學(xué)院,廣西梧州 543002)
六堡茶因其原產(chǎn)于廣西壯族自治區(qū)梧州蒼梧縣六堡鎮(zhèn)而得名,為廣西特色優(yōu)質(zhì)的歷史名茶,并以其“紅、濃、陳、醇”的特性聞名于世。六堡茶的制作以六堡鎮(zhèn)的群體種茶樹(shù)為原料,六堡群體種茶樹(shù)為灌木型中小葉種,樹(shù)勢(shì)開(kāi)展,分枝密。從芽色分,以青苗茶為主,占60%,紫芽茶占20%,茶樹(shù)紅紫色芽葉是一種特異茶葉資源,紫芽六堡茶樹(shù)由于富含花青素成為當(dāng)前茶樹(shù)新品種開(kāi)發(fā)利用的熱點(diǎn)及研究的重點(diǎn)。
簡(jiǎn)單重復(fù)序列(simple sequence repeat,簡(jiǎn)稱SSR)別稱微衛(wèi)星DNA,以1~6個(gè)堿基為核心序列,具有多態(tài)性高、重復(fù)性好、穩(wěn)定性高等特點(diǎn),隨著現(xiàn)代分子技術(shù)的發(fā)展,SSR技術(shù)已廣泛應(yīng)用于植物分子輔助育種、種質(zhì)資源遺傳多樣性、繪制遺傳圖譜等方面的研究中。毛娟等利用30對(duì)茶樹(shù)核心SSR引物,對(duì)3個(gè)代表性的野生和栽培大理茶居群進(jìn)行遺傳分析。陳春林等從紫娟茶樹(shù)轉(zhuǎn)錄組 46 041 條單基因簇(unigene)中篩選出57 976個(gè)SSR位點(diǎn),并對(duì)SSR序列的分布特征進(jìn)行了分析,篩選出44對(duì)高質(zhì)量引物。班秋艷等對(duì)陜西及臨近8個(gè)省份118份茶樹(shù)資源利用表達(dá)序列標(biāo)簽(EST)-SSR分子標(biāo)記進(jìn)行了遺傳多樣性分析。但目前尚未見(jiàn)針對(duì)紫芽六堡茶SSR位點(diǎn)的分析報(bào)告。本研究基于轉(zhuǎn)錄組測(cè)序,首次對(duì)紫芽六堡茶轉(zhuǎn)錄組SSR位點(diǎn)的分布及其序列特征進(jìn)行分析,以期為今后紫芽六堡茶品種選育、功能基因標(biāo)記等提供基礎(chǔ)依據(jù)。
所用鮮茶葉于2021年6月采自廣西壯族自治區(qū)梧州六堡鎮(zhèn)四柳村群體種六堡茶。分別采摘1芽1葉的紫芽、綠芽六堡茶葉片,用離心管裝好,迅速放入液氮中保存。每個(gè)樣品3次重復(fù)。將采集的樣品委托深圳華大基因股份有限公司進(jìn)行轉(zhuǎn)錄組測(cè)序。
針對(duì)Raw數(shù)據(jù),本試驗(yàn)采用SOAPnuke軟件進(jìn)行數(shù)據(jù)的過(guò)濾與質(zhì)控,將包含接頭污染的讀長(zhǎng)(reads)、未知堿基N含量大于5%的reads以及質(zhì)量值低于10的堿基含量大于20%的reads去除,以獲得高質(zhì)量序列。使用Trinity對(duì)干凈讀序(clean reads)進(jìn)行組裝,然后使用Tgicl對(duì)轉(zhuǎn)錄本進(jìn)行聚類去冗余得到unigene。使用MISA( http://pgrc.ipk-gatersleben.de/misa)對(duì)獲得的unigene進(jìn)行SSR位點(diǎn)搜索,搜索標(biāo)準(zhǔn)為單堿基重復(fù)次數(shù)12次以上,雙堿基重復(fù)次數(shù)6次以上,三堿基和四堿基重復(fù)次數(shù)5次以上,五堿基和六堿基重復(fù)次數(shù)4次以上;2個(gè)SSR之間的間隔堿基數(shù)>100 bp,SSR位點(diǎn)距離兩端側(cè)翼序列>150 bp。使用Primer 3 對(duì)檢測(cè)到的SSR進(jìn)行引物設(shè)計(jì)。
所得數(shù)據(jù)使用Excel軟件進(jìn)行處理分析,包括SSR位點(diǎn)的出現(xiàn)頻率、基元類型、基元組成、平均距離等。其中,SSR位點(diǎn)出現(xiàn)頻率是搜索到的SSR總數(shù)與unigene序列總數(shù)的比值;SSR位點(diǎn)的平均距離是搜索到的SSR總數(shù)與總unigene長(zhǎng)度之比,根據(jù)這些數(shù)據(jù)所反映出的特征可以對(duì)SSR 位點(diǎn)的分布特征和序列特征進(jìn)行分析。
通過(guò)對(duì)紫芽六堡茶葉片進(jìn)行轉(zhuǎn)錄組測(cè)序,共獲得去冗余的unigene序列 165 570 條,總長(zhǎng)度為 240 177 233 bp,其中G+C占41.49%。利用軟件SSRFinder對(duì)這些序列數(shù)據(jù)進(jìn)行搜索,共在10 058 條unigene中找到符合條件的SSR,總長(zhǎng)為 238 833 bp,SSR位點(diǎn)發(fā)生的頻率為6.04%,其中,8 867 條unigene含單個(gè)SSR位點(diǎn),1 191條unigene 序列含有1個(gè)以上的SSR位點(diǎn)。共檢出 11 482 個(gè)SSR位點(diǎn),出現(xiàn)的頻率為6.93%。SSR分布的平均距離為 20.92 kb,即平均每 20.92 kb就出現(xiàn)1個(gè)SSR(表1)。
表1 轉(zhuǎn)錄組各SSR位點(diǎn)的分布特征
紫芽六堡茶轉(zhuǎn)錄組中具有較為豐富的SSR堿基類型(表2)。其中重復(fù)率最高的為雙堿基,占SSR位點(diǎn)總數(shù)的55.01%,其次為三堿基、六堿基,分別占28.64%、8.22%,其他的重復(fù)堿基類型所占比例較低(圖1)。各重復(fù)堿基類型的出現(xiàn)頻率存在一定差異。主要集中在雙堿基和三堿基重復(fù)上,占總SSR的83.65%。其中,雙堿基重復(fù)類型出現(xiàn)頻率最高,為3.81%,出現(xiàn)頻率最低的是單堿基重復(fù),僅為0.11%。從分布情況看,轉(zhuǎn)錄組中平均每20.92 kb就出現(xiàn)1個(gè)SSR,不同重復(fù)類型間平均分布距離存在差別。其中,單堿基重復(fù)的平均分布距離最長(zhǎng),為1 264.09 kb;其次是四堿基重復(fù),平均分布距離為839.78 kb;雙堿基重復(fù)的平均距離最短,為38.03 kb。紫芽六堡茶轉(zhuǎn)錄組SSR位點(diǎn)的序列總長(zhǎng)度為238 833 bp,平均長(zhǎng)度為20.80 bp。
表2 紫芽六堡茶轉(zhuǎn)錄組SSR位點(diǎn)不同基元類型的分布狀況
紫芽六堡茶轉(zhuǎn)錄組SSR重復(fù)基元的序列特征詳見(jiàn)表3。由單堿基到六堿基重復(fù)基元種類數(shù)分別為 2、6、30、48、121、460 種,共667種。各堿基重復(fù)基元的數(shù)量分布不均衡,其中,單堿基重復(fù)基元數(shù)量最多的是 A/T,共186個(gè),占SSR總位點(diǎn)數(shù)的1.62%,占單堿基重復(fù)基元總數(shù)的97.89%。雙堿基重復(fù)基元中,數(shù)量最多的類型是GA/TC,共 2 185 個(gè),占SSR總位點(diǎn)數(shù)的19.03%,占雙堿基重復(fù)基元總數(shù)的35.45%;其次是AG/CT,共2 165個(gè),占SSR總位點(diǎn)數(shù)的18.86%,占雙堿基重復(fù)基元總數(shù)的34.28%。三堿基重復(fù)基元中,數(shù)量最多的類型是GAA/TTC,共345個(gè),占SSR總位點(diǎn)數(shù)的3.00%,占三堿基重復(fù)基元總數(shù)的10.49%;其次是AGA/TCT,共288個(gè),占SSR總位點(diǎn)數(shù)的2.51%,占三堿基重復(fù)基元總數(shù)的8.76%。四堿基重復(fù)基元中,數(shù)量最多的類型是AAAT/ATTT,共55個(gè),占SSR總位點(diǎn)數(shù)的0.48%,占四堿基重復(fù)基元總數(shù)的19.23%。
表3 SSR 位點(diǎn)重復(fù)的基元序列特征
五堿基重復(fù)基元中,數(shù)量最多的類型是AAAAG/CTTTT,共48個(gè),占SSR總位點(diǎn)數(shù)的0.42%,占五堿基重復(fù)基元總數(shù)的10.50%。六堿基重復(fù)基元中,數(shù)量最多的類型分別是AAAAAT/ATTTTT、CAAAAA/TTTTTG、GATGAA/TTCATC,各有22個(gè),各占SSR總位點(diǎn)數(shù)的0.19%,各占六堿基重復(fù)基元總數(shù)的2.33%。轉(zhuǎn)錄組中不同SSR重復(fù)基元類型的比例詳見(jiàn)圖2。
SSR的多態(tài)性受重復(fù)堿基序列長(zhǎng)度的影響,而重復(fù)堿基序列長(zhǎng)度由SSR重復(fù)次數(shù)決定。通過(guò)對(duì)紫芽六堡茶轉(zhuǎn)錄組中不同基元類型SSR位點(diǎn)重復(fù)出現(xiàn)次數(shù)的統(tǒng)計(jì)(表4)可知,6種基元重復(fù)次數(shù)主要集中在4~12次,重復(fù)出現(xiàn)4~12次的SSR位點(diǎn)數(shù)共計(jì)9 941個(gè),占總SSR位點(diǎn)數(shù)的86.58%。其中,重復(fù)出現(xiàn)6次和5次的SSR位點(diǎn)數(shù)最多,分別占總SSR位點(diǎn)數(shù)的16.63%(1 910個(gè))、15.89%(1 825個(gè));其次為重復(fù)7次和8次的,分別占總SSR位點(diǎn)數(shù)的10.53%(1 209個(gè))、9.80%(1 125個(gè))。統(tǒng)計(jì)發(fā)現(xiàn),在重復(fù)出現(xiàn)6次的SSR位點(diǎn)中,雙堿基最多(1 062個(gè)),其次是三堿基(673個(gè)),五堿基最少(僅20個(gè))。重復(fù)出現(xiàn)5次的SSR位點(diǎn)中,三堿基最多(1 375個(gè)),四堿基、五堿基、六堿基的數(shù)量差別不大。SSR位點(diǎn)重復(fù)次數(shù)在12次以上的基元占總SSR位點(diǎn)數(shù)的13.42%。不同基元類型不同重復(fù)次數(shù)的SSR位點(diǎn)數(shù)分布情況見(jiàn)圖3。從圖3可以看出,隨著重復(fù)次數(shù)的增多,SSR位點(diǎn)的數(shù)量逐漸下降。
表4 不同基元類型不同重復(fù)次數(shù)的SSR 位點(diǎn)數(shù)量
紫芽六堡茶轉(zhuǎn)錄組SSR重復(fù)片段的長(zhǎng)度分布情況見(jiàn)圖4。SSR序列長(zhǎng)度變化在12~70 bp之間,平均長(zhǎng)度為20.80 bp。其中長(zhǎng)度為24 bp的SSR位點(diǎn)數(shù)最多,共有1 838個(gè),占SSR總數(shù)的16.01%。長(zhǎng)度在12~20 bp的SSR有6 424個(gè),占SSR總數(shù)的55.95%;>20 bp的SSR有5 058個(gè),占SSR總數(shù)的44.05%。雙堿基中最常見(jiàn)的長(zhǎng)度是12 bp(1 021個(gè),9.24%),長(zhǎng)度變化幅度最大,最小為 12 bp 最長(zhǎng)為70 bp。三堿基中最多的長(zhǎng)度為15 bp(1 375個(gè),11.98%)。四堿基、五堿基均以20 bp為主,分別有186(1.62%)、307(2.67%)個(gè)。六堿基中長(zhǎng)度以24 bp(668個(gè),5.82%)數(shù)量最多。
通過(guò)對(duì)紫芽六堡茶進(jìn)行轉(zhuǎn)錄組測(cè)序,共獲得165 570 條unigene序列,總長(zhǎng)度為240 177 233 bp,共搜索到11 482個(gè)SSR位點(diǎn),出現(xiàn)頻率為6.93%,略低于楊華等報(bào)道的茶樹(shù)轉(zhuǎn)錄組中SSR位點(diǎn)出現(xiàn)頻率(9.64%),但高于南方紅豆杉(2.07%)、杜仲(2.90%)、短絲木樨(4.64%)、銀杏(5.95%)、馬尾松(3.45%)、云南松(3.07%)、甘薯(4.4%)等植物。紫芽六堡茶轉(zhuǎn)錄組SSR分布的平均距離為20.92 kb,分布水平高于云南松(29.00 kb)、杜仲(26.31 kb)、藤茶(31.69 kb)等植物。與其他已報(bào)道的茶樹(shù)比較(表5)可知,紫芽六堡茶的SSR位點(diǎn)出現(xiàn)頻率和平均距離與其他茶樹(shù)存在較大差異,這可能與本研究中搜索SSR的算法不一致、數(shù)據(jù)處理方法不同、以及進(jìn)化程度不同等因素有關(guān)??傮w來(lái)說(shuō),紫芽六堡茶轉(zhuǎn)錄組中SSR位點(diǎn)的種類和數(shù)量還是較為豐富的,可為今后分子育種提供依據(jù)。
表5 不同茶樹(shù)品種SSR位點(diǎn)信息比較
大多數(shù)研究表明,植物SSR重復(fù)基元以雙堿基與三堿基重復(fù)為主。本研究發(fā)現(xiàn)紫芽六堡茶轉(zhuǎn)錄組SSR重復(fù)基元以雙堿基重復(fù)最多,占SSR位點(diǎn)總數(shù)的55.01%,其次為三堿基重復(fù),占SSR位點(diǎn)總數(shù)的28.64%,這與陳春林等報(bào)道的茶樹(shù)SSR優(yōu)勢(shì)重復(fù)類型一致。銀杏、獼猴桃、杏樹(shù)和桃樹(shù)等植物也是以雙堿基重復(fù)為主。而玉米、水稻、小麥等禾谷類作物則以三堿基重復(fù)為主。經(jīng)統(tǒng)計(jì),紫芽六堡茶單堿基的優(yōu)勢(shì)重復(fù)基元為A/T,與已報(bào)道的大多茶樹(shù)單堿基優(yōu)勢(shì)重復(fù)基元一致;雙堿基的優(yōu)勢(shì)重復(fù)基元為GA/TC,而已報(bào)道的茶樹(shù)中則多以AG/CT為主;三堿基的優(yōu)勢(shì)重復(fù)基元為GAA/TTC,與龍井43一致;四堿基的優(yōu)勢(shì)重復(fù)基元為AAAT/ATTT,與龍井43、舒茶早、云抗10號(hào)、紫鵑等茶樹(shù)一致;五堿基的優(yōu)勢(shì)重復(fù)基元為AAAAT/ATTTT,與舒茶早、云抗10號(hào)一致;六堿基的優(yōu)勢(shì)重復(fù)基元為AAAAAT/ATTTTT,與云抗10號(hào)一致(表6)。表明基于轉(zhuǎn)錄組測(cè)序得到的SSR位點(diǎn)中可能普遍大量存在這類重復(fù)基元,推測(cè)可能是某些特定的DNA家族或者輔助合成某些優(yōu)勢(shì)蛋白。此外,在搜索到的紫芽六堡茶SSR位點(diǎn)中還發(fā)現(xiàn)了在高等植物轉(zhuǎn)錄組中較為少見(jiàn)的CG/GC 重復(fù)基元11個(gè),以及在雙子葉植物中不常見(jiàn)的CCG/CGG重復(fù)基元45個(gè),這些位點(diǎn)可能與一些特定的生理功能,如抗逆性、信號(hào)傳導(dǎo)、代謝調(diào)控等有關(guān),表明紫芽六堡茶的SSR位點(diǎn)具有一定的特異性。
表6 不同茶樹(shù)品種SSR位點(diǎn)重復(fù)基元序列最多的堿基組成
有研究認(rèn)為,SSR的多態(tài)性與SSR基元重復(fù)次數(shù)及序列長(zhǎng)度密切相關(guān)。一般認(rèn)為重復(fù)次數(shù)越多,長(zhǎng)度越長(zhǎng),多態(tài)性越高,當(dāng)重復(fù)次數(shù)>12次時(shí),多態(tài)位點(diǎn)含量高,紫芽六堡茶基元重復(fù)次數(shù)在12次以上的占13.42%。當(dāng)SSR長(zhǎng)度在12~20 bp之間時(shí),多態(tài)性表現(xiàn)一般;當(dāng)SSR長(zhǎng)度>20 bp時(shí),則具有較高的多態(tài)性。紫芽六堡茶轉(zhuǎn)錄組的SSR平均長(zhǎng)度為20.80 bp,其中序列長(zhǎng)度>20 bp的占44.05%,高于四球茶(33.22%)、龍井43(19.77%)以及舒茶早(8.65%)。表明紫芽六堡茶轉(zhuǎn)錄組SSR具有很高多態(tài)性和利用價(jià)值。
綜上所述,本研究結(jié)果表明,紫芽六堡茶的SSR種類豐富、可用性高、多態(tài)性高??蔀檫M(jìn)一步開(kāi)發(fā)紫芽六堡茶功能基因SSR分子標(biāo)記奠定基礎(chǔ),對(duì)六堡茶種質(zhì)資源的保護(hù)及茶樹(shù)特定性狀的輔助選育、基因組學(xué)的研究等方面都具有重要的意義。