張婷婷,張鶴山,宋康杰,趙澤宇,許本波,劉 洋
(1.長(zhǎng)江大學(xué)生命科學(xué)學(xué)院, 湖北 荊州 434025;2.動(dòng)物胚胎及分子育種湖北重點(diǎn)實(shí)驗(yàn)室 /湖北省農(nóng)業(yè)科學(xué)院畜牧獸醫(yī)研究所, 湖北 武漢 430064)
白三葉(Trifolium repens)在世界溫帶和亞熱帶地區(qū)廣泛分布[1-2],在我國(guó)西南、華中、華北、東北等地區(qū)有野生分布。白三葉適應(yīng)性強(qiáng),蛋白含量高,適口性好,幾個(gè)世紀(jì)以來(lái)一直作為優(yōu)質(zhì)蛋白飼料被人們飼喂家畜[3],在鄂、湘、川、云、貴等省(區(qū))有大面積栽培。據(jù)統(tǒng)計(jì),云南有一半的栽培草地混播了白三葉,湖北也建植了近4 萬(wàn)hm2的白三葉混播草地[4]。此外,白三葉生有固氮作用的根瘤,并且花期長(zhǎng)、葉形美觀,在南方草地生態(tài)建設(shè)、果園生草和景觀綠化方面亦具有很高的利用價(jià)值[5]。
分子標(biāo)記技術(shù)被廣泛用于植物聚類(lèi)分析、種質(zhì)資源鑒定和基因定位[6-8]。簡(jiǎn)單重復(fù)序列(simple sequence repeats, SSRs)主要指在真核生物基因組非編碼區(qū)中,重復(fù)核心序列較短(1~6)而重復(fù)次數(shù)較多的串聯(lián)重復(fù)序列。SSR 廣泛存在于真核生物中,是基于PCR 的共顯性標(biāo)記[9],具有豐富的基因組水平多態(tài)性,并且在同一物種不同的種質(zhì)材料間可以高度表達(dá)[10-12],因此,SSR 標(biāo)記被認(rèn)為是植物染色體組分析的理想技術(shù)[13],被 廣泛應(yīng)用于遺傳多樣性的評(píng)估、種群遺傳結(jié)構(gòu)分析、系譜確定、構(gòu)建遺傳圖譜等多個(gè)領(lǐng)域。
研究發(fā)現(xiàn)SSR 分子標(biāo)記技術(shù)可簡(jiǎn)單、高效開(kāi)展遺傳多樣性和基因定位研究。國(guó)外Jones 等[14]和Barrett 等[15]分別利用78 對(duì)、365 對(duì)SSR引物標(biāo)記了135 個(gè)、493 個(gè)位點(diǎn)。國(guó)內(nèi)李莉等[16-17]利用SSR 技術(shù)分析了貴州白三葉種群和不同種質(zhì)間同一花序的多樣性,夏巖石等[18]將菜薹品質(zhì)和SSR 標(biāo)記進(jìn)行了關(guān)聯(lián)分析,這些研究為白三葉種質(zhì)資源的創(chuàng)新利用提供了技術(shù)支持。盡管如此,目前用于白三葉種質(zhì)資源研究的專(zhuān)用引物及白三葉特異性引物仍然較少,已經(jīng)制約了白三葉分子輔助育種技術(shù)的發(fā)展。鑒于此,本研究以不同花瓣顏色的白三葉轉(zhuǎn)錄組測(cè)序?yàn)榛A(chǔ),利用生物信息學(xué)方法分析白三葉SSR 位點(diǎn)序列分布特征、堿基重復(fù)類(lèi)型、引物設(shè)計(jì)等信息,并開(kāi)發(fā)具有多態(tài)性的白三葉SSR 標(biāo)記,以期為白三葉遺傳信息分析、種質(zhì)資源高效鑒定及雜種優(yōu)勢(shì)利用等方面提供理論支持。
白三葉種植于湖北省農(nóng)業(yè)科學(xué)院牧草種質(zhì)資源圃(114°10′ E,30°18′ N,海拔31 m),在開(kāi)花期采集生長(zhǎng)良好的白三葉花瓣,3 次生物學(xué)重復(fù),液氮速凍后保存-80 ℃冰箱。由北京百邁客生物科技有限公司完成樣品RNA-seq 測(cè)序。
用于多態(tài)性引物篩選的白三葉種質(zhì)如表1 所列,其中來(lái)自丹麥和德國(guó)的材料各2 份,來(lái)自美國(guó)的材料4 份,來(lái)自新西蘭的材料6 份,來(lái)自英國(guó)和中國(guó)的材料各3 份。除來(lái)自于中國(guó)云南和貴州的2 個(gè)白三葉材料為野生類(lèi)型外,其他材料均為栽培品種。
表1 材料及其來(lái)源Table 1 Experimental materials and their sources
轉(zhuǎn) 錄 組 數(shù) 據(jù) 已 上 傳 至GEO (Gene Expression Omnibus database)數(shù)據(jù)庫(kù),登錄號(hào)為GSE101059。利用MicroSatellite (MISA,http://pgrc.ipk-gatersleben.de/misa/)軟件定位、識(shí)別轉(zhuǎn)錄組unigene 數(shù)據(jù)中的SSR 位點(diǎn)。參數(shù)標(biāo)準(zhǔn)為:重復(fù)單元1~6 bp,單堿基和二堿基的最低重復(fù)參數(shù)分別為10 次和6 次,三堿基、四堿基、五堿基和六堿基最低重復(fù)5 次,SSR 位點(diǎn)兩側(cè)序列長(zhǎng)度大于50 nt。
利 用 Primer 6.0 設(shè) 計(jì)SSR 正 向 引 物 和 反 向 引物。引物長(zhǎng)度控制為18~25 nt (堿基),Tm 值55~65 ℃,GC 含量40%~60%,產(chǎn)物長(zhǎng)度80~300 bp。為更清晰地讀取譜帶數(shù)據(jù),將每條引物的正向引物加上通用M13 接頭序列“TGTAAAACGACGGCC AGT”,合成含HEX 熒光基團(tuán)M13 熒光接頭引物。
本研究以來(lái)自不同地區(qū)的20 個(gè)白三葉種質(zhì)為材料,從批量設(shè)計(jì)的引物中隨機(jī)選擇60 對(duì)檢測(cè)其SSR 位點(diǎn)多態(tài)性。
采用CTAB 法提取白三葉葉片總DNA[19]。以DNA 為模板,進(jìn)行三引物PCR 擴(kuò)增(反向引物、M13 接頭引物和M13 熒光接頭引物),PCR 反應(yīng)體系中包含1 μL 模板DNA,5 μL PCR Master Mix (天一輝遠(yuǎn)),0.1 μL 正向引物,M13 接頭引物0.4 μL,0.4 μL熒光M13 引物,用ddH2O 補(bǔ)足10 μL。擴(kuò)增程序如下:95 ℃ 預(yù)變性5 min;分別擴(kuò)增30 個(gè)循環(huán)(95 ℃變性 30 s,60 ℃退火30 s,72 ℃延伸30 s)和8 個(gè)循環(huán)(95 ℃變性 30 s,52 ℃退火30 s,72 ℃延伸30 s);72 ℃保溫10 min。利用毛細(xì)管熒光電泳檢測(cè)PCR產(chǎn)物,統(tǒng)計(jì)條帶情況。
白三葉SSR 位點(diǎn)總數(shù)為24 960 個(gè),分布于20 142條序列上,平均每5.29 kb 中出現(xiàn)1 個(gè)SSR 位點(diǎn),出現(xiàn)頻率為13.25%。含1 個(gè)以上SSR 位點(diǎn)的序列有3701條,含有復(fù)合SSR 位點(diǎn)的序列有1 940 條。白三葉轉(zhuǎn)錄組中共有273 種重復(fù)單元,其中,單堿基重復(fù)有兩種,即C/G 重復(fù)和A/T 重復(fù),以A/為主,共6 202 個(gè),出現(xiàn)頻率和平均距離也最高,分別為3.29%和21.30 kb;二堿基重復(fù)共4 種,AG/CT 重復(fù)最多,最少的是CG/CG 重復(fù),只占二堿基重復(fù)的0.18%;三堿基重復(fù)數(shù)量最多的是AAG/CTT,出現(xiàn)頻率為1.18%;四堿基重復(fù)有27 種,有5 種只存在于1 處,最多的有189 處,即AAAT/ATTT;五堿基重復(fù)共有79 種,其中,AAAAT/ATTTT 最多,有82 處;六堿基重復(fù)的種類(lèi)最多,共有151 種,但每一種重復(fù)的數(shù)量均較少,最多的AATCAT/ATGATT 也只有22 處(表2)。在這6 種堿基重復(fù)中,種類(lèi)與數(shù)量成反比,既數(shù)量越少,但重復(fù)種類(lèi)卻更多,比如六堿基重復(fù)的數(shù)量最少,但其種類(lèi)最多。
表2 白三葉轉(zhuǎn)錄組SSR 基元類(lèi)型Table 2 Transcriptome SSR repeat types in Trifolium repens transcripts
在每一類(lèi)型堿基基元中,重復(fù)數(shù)量隨重復(fù)次數(shù)的增加而減少。單堿基、二堿基和三堿基重復(fù)中,重復(fù)最多次數(shù)的數(shù)值分別為12 次、6 次和5 次,分別 有2 194 處、2 113 處 和4 620 處,占 比 分 別 為35.13%、31.16%和49.09%;四堿基、五堿基、六堿基重復(fù)中,重復(fù)最多次數(shù)的數(shù)值分別為5 次、4 次和4 次,分別有532 處、655 處和520 處,占比由64.33%到79.11%最后上升至85.86%,由此可以看出,重復(fù)最多次數(shù)的數(shù)值在降低,占比卻在升高。在單堿基重復(fù)到六堿基重復(fù)的過(guò)程中,重復(fù)次數(shù)的類(lèi)型逐漸降低。單堿基重復(fù)中的重復(fù)次數(shù)有38 種類(lèi)型,二堿基和三堿基重復(fù)中的重復(fù)次數(shù)分別有37 種和23種,但四堿基、五堿基、六堿基重復(fù)的重復(fù)次數(shù)僅分別有12、10 和12 種(表3)。
表3 SSR 重復(fù)次數(shù)Table 3 SSR number of replications
白三葉SSR 重復(fù)片段平均長(zhǎng)度為18 bp,SSR 重復(fù)的長(zhǎng)度主要集中在12~35 bp,有24 069 條,占了總數(shù)的96.43%,其中,數(shù)量最多的為15、12 和18 bp,分 別 有5 216、4 307 和3 109 條;36~132 bp 只 有891 條,占總數(shù)的3.57%,其中,最長(zhǎng)的4 種長(zhǎng)度為92、93、126 和132 bp,只有1~2 條(圖1)。
圖1 SSR 長(zhǎng)度總的分布情況Figure 1 Distribution of total SSR length
為了篩選出可應(yīng)用于白三葉相關(guān)分析的SSR分子標(biāo)記,利用軟件對(duì)24 960 個(gè)SSR 位點(diǎn)進(jìn)行引物設(shè)計(jì)(表4),共設(shè)計(jì)出18 549 對(duì)引物,長(zhǎng)度為18~28 bp,預(yù)測(cè)擴(kuò)增產(chǎn)物大小為80~240 bp,退火溫度為55.00~63.50 ℃,正反引物溫差不大于6 ℃。在設(shè)計(jì)的18 549 對(duì)SSR 引物中,擴(kuò)增產(chǎn)物最多的為三堿基重復(fù),有11 589 對(duì),占62.48%;其次是二堿基重復(fù),有4 953 對(duì),占26.70%;剩下4 種重復(fù)類(lèi)型設(shè)計(jì)出的引物占比均不大。盡管單堿基重復(fù)SSR 位點(diǎn)有6 246處,占總數(shù)的25.02%,但設(shè)計(jì)出的引物只有69 處,僅占所有引物的0.37%。
表4 設(shè)計(jì)的SSR 引物統(tǒng)計(jì)信息Table 4 Statistics of designed SSR primers
為進(jìn)一步檢驗(yàn)設(shè)計(jì)引物的有效性和實(shí)用性,本研究利用20 個(gè)不同生態(tài)背景的白三葉種質(zhì)材料對(duì)隨機(jī)選取的60 對(duì)引物的多態(tài)性進(jìn)行了多態(tài)性檢測(cè)。結(jié)果表明,52 對(duì)引物能擴(kuò)增出目的條帶,引物擴(kuò)增率為86.7%。將熒光PCR 產(chǎn)物進(jìn)行毛細(xì)管電泳檢測(cè),33 對(duì)引物的擴(kuò)增產(chǎn)物能檢測(cè)到目的片段,占引物數(shù)量的63.5%,其中具有多態(tài)性位點(diǎn)的引物有17 對(duì),占32.7%。
以篩選出的多態(tài)性引物擴(kuò)增出的毛細(xì)管峰圖為基礎(chǔ),選取5 對(duì)具有代表性的引物ZHS11、ZHS39、ZHS41、ZHS56 和ZHS109 構(gòu)建DNA 指紋圖譜,引物信息如表5 所列。ZHS41 的144 bp、ZHS11 的214 bp、ZHS56 的230 bp 分 別 可 以 將EM10、EM17 和EM18 區(qū) 分 出 來(lái)(圖2)。EM7 和EM10 在ZHS11 的166 bp 處均有條帶,但EM7 還有178 bp、190 bp 和202 bp 條帶而EM10 沒(méi)有,因此可以把EM7 區(qū)分出來(lái)。以此類(lèi)推,這5 對(duì)引物可以將20 份白三葉品種在分子層面區(qū)別出來(lái),說(shuō)明由這5 對(duì)引物所構(gòu)建的20 份白三葉DNA 指紋圖譜具有較強(qiáng)的鑒定、區(qū)別能力。
圖2 20 份白三葉品種的DNA 指紋圖譜Figure 2 DNA Fingerprinting of 20 white clover cultivars
表5 引物信息Table 5 SSR primer information
SSR 的數(shù)量和物種進(jìn)化水平相關(guān),數(shù)量越多表明進(jìn)化時(shí)間較長(zhǎng)或變異頻率較高,相反則表明其變異水平越低[20]。本研究表明,白三葉轉(zhuǎn)錄組中平均每5.29 kb 中出現(xiàn)一個(gè)SSR 位點(diǎn),其頻率高于高加索三葉草(T.ambiguum)[21]、雜花苜蓿(Medicago varia)[22],低于矩鐮莢苜蓿(M.archiducis-nicolai)[23],這種差異可能和物種之間SSR 位點(diǎn)的表達(dá)差異有關(guān)[24]。通常認(rèn)為物種中的高級(jí)重復(fù)基元即四堿基、五堿基、六堿基重復(fù)越多,其變異水平越低,低級(jí)重復(fù)基元即單堿基、二堿基、三堿基重復(fù)越多,其進(jìn)化時(shí)間較長(zhǎng)或變異頻率較高[25]。白三葉轉(zhuǎn)錄組中SSR 重復(fù)主要為單核苷酸、二核苷酸和三核苷酸重復(fù),由此可見(jiàn),白三葉具有較長(zhǎng)的進(jìn)化時(shí)間和較高的進(jìn)化頻率。
SSR 位點(diǎn)長(zhǎng)度與多態(tài)性相關(guān),SSR 位點(diǎn)長(zhǎng)度≥ 20 bp 時(shí)具有較高的多態(tài)性,12~19 bp 時(shí)多態(tài)性中等, <12 bp 時(shí)多態(tài)性極低[17]。本研究中,白三葉轉(zhuǎn)錄組SSR 位 點(diǎn) 長(zhǎng) 度≥ 20 bp 的 有7 343 處,占 總 數(shù) 的29.42%,說(shuō)明白三葉SSR 位點(diǎn)的多態(tài)性水平較高。分子標(biāo)記的多態(tài)性是判斷其可用性的重要依據(jù),數(shù)量豐富、多態(tài)性潛能高的低級(jí)SSR 重復(fù)基序是高效開(kāi)發(fā)白三葉良好的前提,本研究中的白三葉SSR 多態(tài)性較好,是后續(xù)分子標(biāo)記的試驗(yàn)基礎(chǔ)。
本研究中,根據(jù)白三葉轉(zhuǎn)錄組SSR 設(shè)計(jì)出的引物的擴(kuò)增產(chǎn)物最多的為三堿基重復(fù),其次是二堿基重復(fù),這說(shuō)明進(jìn)化時(shí)間較長(zhǎng)、多態(tài)性較高的SSR 更有可能被用來(lái)作為特異性引物。品種或種質(zhì)資源的特異性是新品種保護(hù)的技術(shù)基礎(chǔ)和授權(quán)的科學(xué)依據(jù)[25]。利用分子標(biāo)記技術(shù)構(gòu)建品種指紋圖譜,可以快速準(zhǔn)確地進(jìn)行品種(系)的鑒定,同時(shí)具有很強(qiáng)的個(gè)體特異性,為作物育種和種子管理工作提供了極大的便利[26]。SSR 分子標(biāo)記技術(shù)作為比較理想的分子標(biāo)記技術(shù)之一[27],已被廣泛應(yīng)用于豆科牧草如苜蓿[28]、紅三葉(T.pratense)[29]、紅豆草(Onobrychis viciifolia) [30]等多個(gè)物種的品種鑒定。本研究篩選出具有較高多態(tài)性的SSR 引物,對(duì)20 份白三葉品種構(gòu)建DNA 指紋圖譜。DNA 指紋圖譜的構(gòu)建對(duì)白三葉種質(zhì)創(chuàng)新、品種選育及鑒定均具有積極作用,也可為新品種知識(shí)產(chǎn)權(quán)保護(hù)與有效利用提供保障。馬驄毓等[30]利用6 對(duì)引物為13 個(gè)白三葉品種構(gòu)建了指紋圖譜,經(jīng)過(guò)比較分析,與本研究所利用的白三葉品種和引物均不相同。就本研究而言,隨著白三葉國(guó)外品種的不斷引進(jìn)且篩選的引物數(shù)量有限,特征條帶也可能在其他品種中出現(xiàn),因此目前的引物組合僅在一定的材料范圍內(nèi)適用。
白三葉轉(zhuǎn)錄組中SSR 位點(diǎn)分布頻率較高,分布密度大,重復(fù)基元種類(lèi)豐富,具有較高的特異性和多態(tài)性?;诎兹~轉(zhuǎn)錄組SSR 位點(diǎn)批量設(shè)計(jì)并篩選多態(tài)性引物是可行的。本研究將為白三葉多態(tài)性及特異性引物的開(kāi)發(fā)、遺傳多樣性評(píng)價(jià)及分子標(biāo)記輔助育種等方面的研究提供理論依據(jù)。