石桃雄,黎瑞源,黃 娟,陳慶富,梁成剛**
(1.貴州師范大學(xué) 蕎麥產(chǎn)業(yè)技術(shù)研究中心,貴州 貴陽 550001;2.貴州省信息與計(jì)算科學(xué)重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550001)
蕎麥(FagopyrmMill)屬蓼科雙子葉植物,有甜蕎(Fagopyrmesculentum)和苦蕎(Fagopyrumtartaricum)兩個栽培種。甜蕎又名普通蕎麥(Common buckwheat),主要種植在我國華北、西北和東北地區(qū)[1]。甜蕎含有豐富的蛋白質(zhì)、脂肪、粗纖維、維生素、無機(jī)鹽和多種有益于人體的微量元素,且含有小麥、大米和玉米等谷類作物沒有的蘆丁和葉綠素等生物活性物質(zhì)[2],因此其營養(yǎng)價值明顯高于谷類作物,是我國重要的糧藥兼用的雜糧作物之一。
我國甜蕎種質(zhì)資源豐富,在編入“中國蕎麥品種資源目錄”的2704份蕎麥種質(zhì)中,甜蕎占67.43%[3]。評價甜蕎種質(zhì)資源的遺傳多樣性有利于優(yōu)異基因的挖掘和新品種的培育。SSR標(biāo)記具有數(shù)量多、多態(tài)性豐富、操作簡單、擴(kuò)增結(jié)果穩(wěn)定等優(yōu)點(diǎn),是目前蕎麥屬植物遺傳多樣性研究和遺傳圖譜構(gòu)建最常用的分子標(biāo)記[4]。隨著高通量測序技術(shù)成本的降低,前人已根據(jù)苦蕎基因組[5,6]和轉(zhuǎn)錄組[7-9]序列大規(guī)模發(fā)掘了SSR位點(diǎn),并將這些位點(diǎn)應(yīng)用于苦蕎種質(zhì)資源遺傳多樣性評價[10,11]、群體結(jié)構(gòu)分析[12]、遺傳圖譜構(gòu)建[13]和重要農(nóng)藝性狀的關(guān)聯(lián)分析[14]等研究。近年來,甜蕎參考基因組序列[15]以及籽粒[16-19]、花[20]和根[21]等組織的高通量轉(zhuǎn)錄組序列已相繼被公布,為甜蕎大規(guī)模SSR標(biāo)記的開發(fā)奠定了基礎(chǔ)。Shi等[10]分析了甜蕎籽粒轉(zhuǎn)錄組SSRs的分布特征,從合成的150對SSR引物中篩選到36對多態(tài)性SSR引物,并比較了SSR引物在甜蕎和苦蕎中的通用性。目前已開發(fā)的甜蕎SSR標(biāo)記不超過300對,遠(yuǎn)遠(yuǎn)不能滿足其應(yīng)用于遺傳圖譜構(gòu)建、數(shù)量性狀的QTL定位和關(guān)聯(lián)分析等研究。本文根據(jù)甜蕎根轉(zhuǎn)錄組高通量測序獲得了Transcripts序列,分析了SSRs的分布、重復(fù)類型、基序種類和重復(fù)次數(shù)等特征,并基于檢索到的SSRs設(shè)計(jì)全部的引物,篩選了與黃酮類物質(zhì)合成相關(guān)的SSR引物。
基于甜蕎品種豐甜1號根系轉(zhuǎn)錄組高通量測序數(shù)據(jù),利用Misa軟件在默認(rèn)參數(shù)下對長度大于200 bp的Transcripts序列進(jìn)行了SSR位點(diǎn)掃描,篩選標(biāo)準(zhǔn)為:單核苷酸重復(fù)次數(shù)≥10;二核苷酸重復(fù)次數(shù)≥6;三至六核苷酸重復(fù)次數(shù)≥5;將相距20個堿基以內(nèi)的SSR位點(diǎn)視為復(fù)合型位點(diǎn)。利用Excel 2019對獲得的SSRs進(jìn)行統(tǒng)計(jì)分析。
根據(jù)Transcripts拼接的Unigenes序列,采用Krait v0.10.2軟件,在默認(rèn)的參數(shù)下設(shè)計(jì)SSR引物。根據(jù)Unigenes注釋信息篩選與黃酮生物合成相關(guān)的結(jié)構(gòu)基因的SSR引物。
對甜蕎根轉(zhuǎn)錄組測序,共獲得了55392條長度大于200 bp的Transcripts序列,其中,長度介于201~400 bp的Transcripts數(shù)量最多,有23249條,占總數(shù)的41.97%;其次是長度>1000 bp的Transcripts,有15647條,占總數(shù)的28.25%。含有SSR位點(diǎn)的Transcripts共3906條,SSR的分布頻率為7.54%。隨著Transcripts序列長度的增加,SSR的分布頻率和出現(xiàn)頻率均增高,平均每1.709 kb出現(xiàn)1個SSR位點(diǎn)(表1)。
表1 甜蕎根轉(zhuǎn)錄組SSR位點(diǎn)數(shù)量及頻率
對SSRs重復(fù)類型的統(tǒng)計(jì)分析結(jié)果顯示:在3906個SSRs中,2133個(占54.61%)分布在長度>1000 bp的Transcripts序列中;688個(17.61%)分布在長度介于201~400 bp的Transcripts序列中;在長度介于401~600、601~800和801~1000 bp的Transcripts序列中分別含有400個(占10.24%)、366個(9.37%)和319個(8.17%)SSRs。
在3906個SSRs中,單核苷酸重復(fù)類型數(shù)量最多,為1880個,占總數(shù)的48.13%;其次是三核苷酸重復(fù)類型,為1253個,占總數(shù)的32.07%;第三是二核苷酸重復(fù)類型,為609個,占總數(shù)的15.59%;四至六核苷酸重復(fù)類型數(shù)量很少,總共64個,占總數(shù)的1.63%;另外有100個位點(diǎn)是復(fù)合型,占總數(shù)的2.56%(表2)。
表2 甜蕎根轉(zhuǎn)錄組SSRs的重復(fù)類型、數(shù)量(比例/%)與分布特征
由于單、二和三核苷酸重復(fù)類型占SSRs總數(shù)的95.80%,因此針對這3個類型進(jìn)行了SSR基序類型、數(shù)量與分布特征的統(tǒng)計(jì)分析。表3顯示:在1880個單核苷酸重復(fù)類型中,有(A)n和(T)n兩種基序,其中(A)n占絕對優(yōu)勢,共有1856個,占單核苷酸重復(fù)類型總數(shù)的98.72%,占總SSRs的47.52%;在609個二核苷酸重復(fù)類型中,有(AC)n、(AG)n和(AT)n三種基序,其中(AG)n和(AT)n數(shù)量較多,分別有299和268個,分別占二核苷酸重復(fù)類型總數(shù)的49.10%和44.17%,分別占總SSRs的7.65%和6.86%;在1253個三核苷酸重復(fù)類型中,有(AAC)n、(AAG)n、(AAT)n、(ACC)n、(ACG)n、(ACT)n、(AGC)n、(AGG)n、(ATC)n和(CCG)n等10種基序,其中數(shù)量較多的為(AAG)n、(ATC)n和(ACC)n這3種基序,分別有371、220和192個,分別占三核苷酸總數(shù)的29.60%、17.56%和15.32%,分別占總SSRs的9.49%、5.63%和4.91%。
表3 甜蕎根轉(zhuǎn)錄組SSRs單、二和三核苷酸重復(fù)的基序類型、數(shù)量與分布特征
對單至三核苷酸類型SSR基序重復(fù)次數(shù)的統(tǒng)計(jì)分析結(jié)果顯示:SSRs以10次重復(fù)的頻率最高,有994個,占25.45%;其次為5次重復(fù),有809個,占20.71%。在每個重復(fù)類型中,SSR數(shù)量均隨著基序重復(fù)次數(shù)的增加而減少。在1880個單核苷酸SSRs中,10次重復(fù)的SSRs數(shù)量最多,達(dá)960個,占單核苷酸數(shù)的51.06%和SSRs總數(shù)的24.58%;重復(fù)次數(shù)≥12的SSRs總共有516個,占單核苷酸數(shù)的27.45%和SSRs總數(shù)的13.21%。在609個二核苷酸SSRs中,6次重復(fù)的SSRs數(shù)量最多,為299個,占二核苷酸數(shù)的49.10%和SSRs總數(shù)的7.65%。在1253個三核苷酸SSRs中,5次重復(fù)的SSRs數(shù)量最多,為809個,占三核苷酸數(shù)的64.57%和SSRs總數(shù)的20.71%(表4)。
黃酮類化合物是甜蕎的主要藥用成分之一?;?793個含有SSR位點(diǎn)的Unigenes序列,共成功設(shè)計(jì)了1183對SSR引物。通過篩選SSR引物源自Unigenes的功能注釋信息,共獲得了3對與黃酮生物合成途徑中關(guān)鍵結(jié)構(gòu)基因相關(guān)的SSR引物(表5),可用于評價甜蕎種質(zhì)資源黃酮生物合成相關(guān)基因內(nèi)部序列的多態(tài)性。
表5 來自黃酮生物合成相關(guān)基因的SSR引物的信息
SSR標(biāo)記根據(jù)來自序列的不同可分為兩種:基因組Genomic-SSR和表達(dá)序列表簽Genic-SSR(EST-SSR)。與Genomic-SSR相比,Genic-SSR源自保守性較高的轉(zhuǎn)錄序列,在物種間的通用性更好。Shi等[16]開發(fā)的150對甜蕎Genic-SSR引物中,32對(20.7%)在苦蕎種質(zhì)中具有多態(tài)性。馬名川等[6]開發(fā)的200對苦蕎Genomic-SSR引物中,48對(24.0%)在甜蕎種質(zhì)中具有多態(tài)性。為了豐富蕎麥屬植物SSR標(biāo)記數(shù)量,本研究挖掘了甜蕎根轉(zhuǎn)錄組SSR位點(diǎn),共獲得了3906個SSR位點(diǎn),SSRs出現(xiàn)頻率為1/1.709 kb,接近于甜蕎的(1/1.17 kb)[16],略低于苦蕎籽粒轉(zhuǎn)錄組的SSRs出現(xiàn)頻率(1/1.73 kb)[9],高于苦蕎基因組(1/21.339 kb)[6]和苦蕎不同品種種皮混合轉(zhuǎn)錄組(1/7.809 kb)[7]SSRs的出現(xiàn)頻率。
SSRs重復(fù)類型和基序的分布與作物種類、檢索條件和序列類型等因素有關(guān)。本文檢索到的3906個SSRs中,單至三核苷酸重復(fù)類型占SSRs總數(shù)的95.80%,數(shù)量從大到小依次為單核苷酸(1880)>三核苷酸(1253)>二核苷酸(609)。不考慮單核苷酸重復(fù),且當(dāng)二、三核苷酸在相同的篩選條件下時,SSRs重復(fù)類型的分布與甜蕎籽粒[16]、苦蕎籽粒轉(zhuǎn)錄組[7-9]和苦蕎基因組[6]一致。前人的研究表明單核苷酸SSRs數(shù)量多,多態(tài)性程度較高,例如,賀潤麗等[7]開發(fā)的41對多態(tài)性Genic-SSR引物中,單核苷酸重復(fù)就有29對(70.73%),因此在開發(fā)蕎麥屬SSR標(biāo)記時,對單核苷酸SSRs應(yīng)予以考慮。本文單核苷酸以(A)n基序出現(xiàn)的頻數(shù)最高,與Shi等[16]和賀潤麗等[7]的研究結(jié)果一致;二核苷酸重復(fù)以(AG)n基序出現(xiàn)的頻數(shù)最高,與甜蕎[16]和苦蕎[8]籽粒轉(zhuǎn)錄組SSR的研究結(jié)果相同,但與苦蕎基因組[5,6]和種皮轉(zhuǎn)錄組[7]中以(AT)n是優(yōu)勢基序的研究結(jié)果不同,說明蕎麥屬植物二核苷酸基序的分布與種屬和組織有關(guān)。三核苷酸重復(fù)以(AAG)n基序數(shù)量最多,與甜蕎[16]、苦蕎轉(zhuǎn)錄組[7-9]和苦蕎基因組[6]SSR的研究結(jié)論一致,也與雙子葉植物Genic-SSRs重復(fù)基序的分布相同,但與谷類作物Genic-SSRs以(GGC)n為優(yōu)勢重復(fù)基序的研究結(jié)果[22]不一致。
本文根據(jù)搜索的全部SSR位點(diǎn)共成功設(shè)計(jì)了1183對SSR引物,為蕎麥屬植物種質(zhì)資源多樣性評價、遺傳圖譜構(gòu)建、基因定位和重要性狀基因的發(fā)掘等研究提供了豐富的SSR標(biāo)記。篩選SSR位點(diǎn)對應(yīng)的Unigenes的功能注釋信息,獲得了3對與黃酮生物合成途徑關(guān)鍵結(jié)構(gòu)基因相關(guān)的SSR引物,可用于評價蕎麥屬植物種質(zhì)資源黃酮代謝相關(guān)基因內(nèi)部序列的多態(tài)性,可為發(fā)展與黃酮含量關(guān)聯(lián)的功能標(biāo)記、分子標(biāo)記輔助改良蕎麥黃酮含量提供依據(jù)。