胡冬梅,江東,李永平,彭磊,李冬云,朱延松,楊云光
1玉溪市農(nóng)業(yè)技術(shù)推廣站,云南玉溪 653100;2西南大學(xué)柑桔研究所,重慶 400712;3云南省綠色食品發(fā)展中心,昆明 650032;4云南農(nóng)業(yè)大學(xué)園林園藝學(xué)院,昆明 650201;5華寧縣柑桔產(chǎn)業(yè)發(fā)展辦公室,云南華寧 652800
【研究意義】柑橘極易發(fā)生芽變,從芽變和實(shí)生選種中獲得的柑橘新品種占所有品種的比例高達(dá)77%[1-2],尤其是一些無(wú)核柑橘品種,如冰糖橙、溫州蜜柑等多數(shù)來(lái)源于芽變。通常,根據(jù)枝、葉、果等植物形態(tài)學(xué)特征就能夠?qū)ρ孔儾牧嫌枰詤^(qū)分,但環(huán)境、氣候、栽培條件的改變會(huì)造成植物形態(tài)學(xué)特征的較大差異,很難通過(guò)形態(tài)特征就將一些品種區(qū)分開(kāi)[3],所以僅靠形態(tài)標(biāo)記很難準(zhǔn)確用于親子關(guān)系的區(qū)分和鑒定,因此利用分子標(biāo)記開(kāi)展品種辨別已成為資源鑒定、品種選育和品種權(quán)保護(hù)的一項(xiàng)重要工作,其關(guān)鍵又在于能夠發(fā)掘出區(qū)分芽變材料差異的分子標(biāo)記?!厩叭搜芯窟M(jìn)展】目前,許多分子標(biāo)記技術(shù)如 RAPD[4-6]、ISSR[7]、SRAP[8]等都被用于芽變材料的區(qū)分和柑橘遺傳背景的研究。隨著深度測(cè)序技術(shù)的發(fā)展,芽變材料的基因組重測(cè)序結(jié)果表明,芽變材料間存在大量的重復(fù)序列變異[9],這為芽變材料的分子標(biāo)記開(kāi)發(fā)提供了重要方向。實(shí)際上,在柑橘基因組上廣泛分布著簡(jiǎn)單重復(fù)序列SSR,又稱作微衛(wèi)星DNA,它是以1—6個(gè)核苷酸為重復(fù)單元構(gòu)成的串聯(lián)重復(fù),在不同個(gè)體或群體之間由于串聯(lián)數(shù)目的不同而呈現(xiàn)出高度的多態(tài)性和變異性。由于SSR在染色體上分布廣泛,基因組覆蓋率較高、數(shù)量豐富,呈共顯性遺傳、并由于其高可靠性和穩(wěn)定性,而被廣泛應(yīng)用于柑橘的遺傳多樣性研究、遺傳圖譜構(gòu)建[10]、種質(zhì)資源鑒定[11-13]和分子標(biāo)記輔助選擇[14]等研究中[1,4-6,15]。由于柑橘芽變材料間的遺傳背景高度相似[11],前人利用 ISSR標(biāo)記僅能鑒別部分芽變品種[11],而溫州蜜柑、甜橙、椪柑、檸檬、葡萄柚中的芽變材料鑒定則相當(dāng)困難。目前SSR的檢測(cè)方法常采用聚丙烯酰胺凝膠電泳或毛細(xì)管熒光電泳等進(jìn)行區(qū)分,由于凝膠分辨率以及制膠、電泳等問(wèn)題,常造成讀帶困難、自動(dòng)化程度較低、耗時(shí)費(fèi)力,一次只能對(duì)少數(shù)SSR位點(diǎn)進(jìn)行基因分型。隨著大量基因組數(shù)據(jù)的公布,對(duì)基因組的比較研究發(fā)現(xiàn)在染色體個(gè)別位置上存在變異熱區(qū)[16-17],利用這些變異熱區(qū)開(kāi)發(fā)SSR標(biāo)記,將有助于材料的區(qū)分和鑒別。同時(shí)利用深度測(cè)序技術(shù)如AmpSeq-SSR、Target-SSR等技術(shù)可一次性對(duì)大量 SSR位點(diǎn)進(jìn)行基因分型,突破了毛細(xì)管電泳檢測(cè)對(duì)SSR位點(diǎn)檢測(cè)數(shù)量的限制[18],且通過(guò)測(cè)序數(shù)據(jù)與已知的參考基因組比對(duì),能夠發(fā)現(xiàn)一些新的轉(zhuǎn)錄本和新基因[19],將有助于個(gè)體識(shí)別以及親緣關(guān)系的鑒定。目前靶位點(diǎn)SSR測(cè)序技術(shù)已經(jīng)在水稻[20]、黃瓜[21]、大戟[22]以及法醫(yī)物證鑒定[23]中得到廣泛應(yīng)用,但該技術(shù)在柑橘芽變材料的鑒定中還沒(méi)有相關(guān)報(bào)道?!颈狙芯壳腥朦c(diǎn)】為提高柑橘芽變品種的分子鑒別能力,本研究首先從變異熱點(diǎn)區(qū)域篩選多態(tài)性較高的SSR位點(diǎn),利用這些SSR位點(diǎn)的高多態(tài)性來(lái)顯著提高芽變材料的鑒別區(qū)分能力。由于多數(shù)情況下單個(gè)SSR并不能區(qū)分芽變材料,因此通過(guò)SSR位點(diǎn)的組合能夠提高芽變材料的檢測(cè)能力,為增加 SSR位點(diǎn)的檢測(cè)數(shù)量、通量和準(zhǔn)確性,并利于自動(dòng)化檢測(cè),本研究采用了 Target-SSR測(cè)序技術(shù),利用多路復(fù)用靶位點(diǎn)PCR擴(kuò)增建立測(cè)序文庫(kù),并運(yùn)用Miseq進(jìn)行測(cè)序和基因分型??梢淮涡垣@得多個(gè) SSR位點(diǎn)基因分型數(shù)據(jù),不僅降低了分型成本,而且分型的結(jié)果更加準(zhǔn)確可靠,能直接確定突變的基因位點(diǎn),對(duì)后續(xù)研究基因變異對(duì)性狀影響意義重大。在本研究中綜合應(yīng)用了高多態(tài)性SSR的數(shù)字挖掘和Target-SSR深度測(cè)序兩種策略,提高了柑橘芽變品種的鑒別能力?!緮M解決的關(guān)鍵問(wèn)題】玉溪是云南省第一大柑橘產(chǎn)地,2019年,全市生產(chǎn)柑橘48.2萬(wàn)t,占云南省柑橘總產(chǎn)量的44.40%。近年來(lái)通過(guò)大力開(kāi)展芽變資源選優(yōu),發(fā)掘了一批有潛力的極早熟、早熟、優(yōu)質(zhì)的柑橘芽變資源。為高效鑒定這些芽變材料,本研究通過(guò)生物信息學(xué)方法發(fā)掘高多態(tài)性SSR位點(diǎn),多路復(fù)用SSR靶位點(diǎn)擴(kuò)增構(gòu)建測(cè)序文庫(kù),并利用Miseq高通量測(cè)序平臺(tái)驗(yàn)證了發(fā)掘出的 SSR位點(diǎn)在區(qū)分芽變材料中的有效性。同時(shí)通過(guò)這些SSR對(duì)22份柑橘材料進(jìn)行遺傳多態(tài)性的分析。本研究建立了柑橘芽變材料區(qū)分和鑒定的高效方法,為今后柑橘種質(zhì)資源的保存、利用和研究奠定了重要基礎(chǔ)。
試驗(yàn)于2019年6月至2020年12月在西南大學(xué)柑桔研究所國(guó)家柑橘資源圃實(shí)驗(yàn)室進(jìn)行。
研究共選用22份柑橘資源,這些材料來(lái)源于云南省玉溪市華寧縣、新平縣在柑橘芽變選優(yōu)活動(dòng)中獲得的疑似芽變材料及其母本(表1),樣本分兩次采集,第二次由于未采集到13號(hào)標(biāo)本,故未納入后續(xù)的聚類分析。這些材料包括一些地方優(yōu)良品種。取每份材料的幼嫩葉片,利用CTAB法[24]提取DNA進(jìn)行遺傳多樣性研究和Target-SSR的PCR擴(kuò)增建庫(kù)。
表1 22份柑橘種質(zhì)資源Table 1 22 citrus accessions used in this study
通過(guò)全基因組掃描方式發(fā)掘SSR,這些SSR位點(diǎn)將用于靶位點(diǎn)的擴(kuò)增和文庫(kù)構(gòu)建。利用GMATA軟件[25]對(duì)克里曼丁紅橘參考基因組(https://www.ncbi.nlm.nih.gov/genome/?term=clementina)進(jìn)行分析,用于搜索全基因組SSR。設(shè)置候選SSR位點(diǎn)的搜索條件為基序模長(zhǎng)至少2 bp,基序重復(fù)至少5次。獲得目的SSR位點(diǎn)69 100個(gè)。再利用NCBI的blastdbcmd軟件提取SSR位點(diǎn)及其側(cè)翼15 bp的序列,并進(jìn)一步利用Blastn比對(duì)去除其中一致性在90%以上冗余重復(fù)序列,余下的13 453個(gè)非重復(fù)SSR序列用于序列提取和隨后的引物設(shè)計(jì)。
為尋找能夠區(qū)分溫州蜜柑芽變材料的SSR,利用NCBI上的溫州蜜柑全基因組測(cè)序數(shù)據(jù),依然選用GMATA軟件預(yù)測(cè)SSR,參數(shù)和處理步驟同克里曼丁紅橘,共獲得80 064個(gè)SSR,去除冗余重復(fù)的SSR,得到15 616項(xiàng)非重復(fù)的SSR。將溫州蜜柑中鑒定到的SSR與克里曼丁紅橘中獲得的非重復(fù) SSR進(jìn)行blast比對(duì),刪除完全一致的SSR,只保留在溫州蜜柑和克里曼丁紅橘間存在基序數(shù)目差異的SSR,這些在克里曼丁紅橘和溫州蜜柑品種間存在差異的 SSR可以認(rèn)為是胚性變異,具有物種特異性,在物種內(nèi)的保守性較強(qiáng)。為進(jìn)一步發(fā)掘能夠區(qū)分溫州蜜柑芽變材料的SSR,從NCBI中下載溫州蜜柑的核酸數(shù)據(jù)共8 503條,這些溫州蜜柑的測(cè)序數(shù)據(jù)來(lái)源于不同地區(qū)、不同栽培品種的測(cè)序數(shù)據(jù),其中核酸序列2 583條,EST序列2 806條,GSS序列3 114條。同樣利用GMATA軟件預(yù)測(cè)SSR。再利用溫州蜜柑與克里曼丁紅橘間有差異的SSR與8 503條溫州蜜柑中獲得的SSR進(jìn)行Blast,發(fā)現(xiàn)匹配的SSR序列共計(jì)2 190個(gè),篩選出在序列比對(duì)中具有多個(gè)hits matches的序列,用于引物設(shè)計(jì)。
根據(jù)獲得的SSR側(cè)翼序列設(shè)計(jì)引物,引物設(shè)計(jì)采用 Primer3軟件[26]進(jìn)行。為驗(yàn)證設(shè)計(jì)引物在芽變材料上的區(qū)分能力,首先對(duì) 22 份柑橘材料進(jìn)行檢測(cè)。試驗(yàn)共設(shè)計(jì)引物 53 對(duì),引物長(zhǎng)度為 18—22 bp,引物Tm值為60—65℃,從中篩選出4對(duì)多態(tài)性較高的SSR引物用于22份柑橘材料的遺傳多樣性研究(表2)。PCR反應(yīng)體系為20 μL,其中包括100 ng DNA模板、10 μL 2×TSINGKE Mastermix酶和1 μL的SSR引物,PCR 條件為:94℃ 5 min;94℃ 30 s,60℃ 30 s,72℃30 s,35個(gè)循環(huán);72℃延伸5 min。反應(yīng)產(chǎn)物利用聚丙烯凝膠電泳后,銀染顯帶進(jìn)行觀測(cè)。
表2 本試驗(yàn)篩選出的4對(duì)多態(tài)性引物Table 2 The four pairs of polymorphic SSR primers used to discriminate 22 citrus accessions
對(duì)22份柑橘資源開(kāi)展遺傳多樣性分析,利用聚丙烯酰凝膠電泳法對(duì)SSR位點(diǎn)進(jìn)行基因分型,根據(jù)SSR電泳條帶的有無(wú)記錄供試材料基因型。1表示有條帶(包括弱帶),0表示無(wú)條帶,構(gòu)建(0,1)矩陣。利用Cervus 3.07軟件[27]對(duì)4對(duì)引物的觀測(cè)等位基因數(shù)、觀測(cè)雜合度、期望雜合度、PIC值等進(jìn)行計(jì)算,通過(guò)GenAlEx 6.51[28]軟件對(duì)22份材料進(jìn)行PCoA分析。
為驗(yàn)證SSR差異條帶在區(qū)分品種上的可靠性和穩(wěn)定性,對(duì)有差異的PCR條帶采用割膠回收純化,回收PCR產(chǎn)物,將PAGE膠搗碎后加入100 μL ddH2O;0℃金屬浴20 min;以水浴后溶液為模板做PCR擴(kuò)增;對(duì)PCR產(chǎn)物進(jìn)行瓊脂糖凝膠電泳后使用微量瓊脂糖凝膠DNA回收試劑盒回收;因回收量過(guò)低,對(duì)回收產(chǎn)物TA克隆后送深圳華大基因公司進(jìn)行檢測(cè)。
為一次性對(duì)多個(gè)SSR靶位點(diǎn)進(jìn)行基因分型,本研究在采用多路復(fù)用擴(kuò)增的方式來(lái)構(gòu)建 Target SSR-seq文庫(kù)。其步驟包括:第一步使用在線工具 Multiple Primer Analyzer對(duì)引物互補(bǔ)結(jié)構(gòu)分析并設(shè)計(jì)合適的引物組合,共設(shè)計(jì)18個(gè)引物組合包含77對(duì)引物,使用多路復(fù)用PCR對(duì)2份溫州蜜柑芽變材料DNA樣品進(jìn)行靶位點(diǎn)SSR的擴(kuò)增。多重PCR反應(yīng)在20 μL反應(yīng)體系中進(jìn)行,其中包括100 ng DNA模板、10 μL 2×Hieff Canace? Gold PCR Master Mix 高保真酶預(yù)混液和3—6 μL的多重SSR引物。PCR條件為:98℃ 3 min;98℃ 30 s,60℃ 30 s,72℃ 30 s,35個(gè)循環(huán);72℃ 5 min延伸。用PCR產(chǎn)物小量回收試劑盒回收。第二步,使用MaxUp II DNA Library Prep Kit for Illumina建庫(kù)試劑盒對(duì)PCR產(chǎn)物建庫(kù),主要步驟包括PCR產(chǎn)物3′端添加A尾的末端修復(fù)反應(yīng)、為產(chǎn)物添加用于Illumina Miseq平臺(tái)的測(cè)序接頭,DNA clean beads純化、為每個(gè)樣品添加特異標(biāo)簽的Index Primer PCR反應(yīng),DNA clean beads純化。此后,將Target SSR-seq文庫(kù)在Illumina MiSeq測(cè)序平臺(tái)上進(jìn)行測(cè)序。
對(duì)測(cè)序后的fastq原始數(shù)據(jù)利用fastqc(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)進(jìn)行質(zhì)控,去除其中的低質(zhì)量序列。質(zhì)控后的數(shù)據(jù)再利用 NextGENe_v2.4.3(https://www.softgenetics.com/NextGENe.php)與克里曼丁紅橘參考基因組進(jìn)行對(duì)比,設(shè)定最低變異位點(diǎn)覆蓋深度為 5、SNP等位基因片段為0.2、同一位置的相同變異數(shù)為2等參數(shù)后,最終獲得vcf和BAM格式文件。利用vcftools(http://vcftools.sourceforge.net/)軟件提取vcf文件中的測(cè)序深度、等位基因頻率、覆蓋深度等信息導(dǎo)入數(shù)據(jù)庫(kù)后,利用數(shù)據(jù)庫(kù)比對(duì)獲得差異性位點(diǎn),利用IGV[29]軟件進(jìn)行變異位點(diǎn)的可視化和監(jiān)測(cè)。變異位點(diǎn)所在序列導(dǎo)入到GeneStudio(https://sourceforge.net/projects/genestudio/)軟件中產(chǎn)生序列對(duì)齊圖。
利用GMATA軟件在克里曼丁紅橘參考基因組中獲得69 101個(gè)SSR,其中2基序SSR占69.5%,3基序SSR占25.7%,4基序SSR占3.8%,5基序SSR占0.7%,6基序SSR占0.3%。在2基序SSR中,以AT/TA的基序數(shù)量最多,占17.5%;在3基序SSR中,以AAT基序最多(3.9%)(圖1)。
在溫州蜜柑全基因組中獲得的80 193個(gè)SSR,其中2基序SSR占69.8%,3基序SSR占25.6%,4基序SSR占3.7%,5基序SSR占0.7%,6基序SSR占0.3%。在2基序SSR中,以AT/TA基序最多,占17.8%;3基序中以AAT最多,占3.9%(圖2)。從兩個(gè)柑橘品種的全基因組序列中,鑒定到的 SSR類型及比例幾乎一致,均是以2基序的AT/TA重復(fù)所占比例最多。
為尋找能夠鑒定柑橘芽變的SSR標(biāo)記,對(duì)溫州蜜柑和克里曼丁紅橘的SSR序列去除重復(fù)后,再利用BLASTn比對(duì)從中發(fā)掘兩個(gè)品種之間存在差異的SSR位點(diǎn),這些存在于品種間的差異SSR在理論上屬于胚性突變。進(jìn)一步對(duì)溫州蜜柑基因組數(shù)據(jù)庫(kù)進(jìn)行SSR的搜索和比對(duì)。發(fā)現(xiàn)其中一些 SSR序列比如BDQV01000095.1_33999 具有 284個(gè)匹配項(xiàng)(hit matches)、BDQV01000126.1_38180具有277個(gè)匹配項(xiàng)、BDQV01000074.1_30393具有170個(gè)匹配項(xiàng),表明這些序列在溫州蜜柑上的同源序列較多,具有較高的多態(tài)性,且在基因組上分布較廣,暗示這些序列有可能來(lái)源于突變熱點(diǎn)區(qū)域,能夠反映體細(xì)胞突變的差異。而且這些序列中的一些往往具有反向重復(fù)特性且含有SSR,暗示其具有一定的生物學(xué)功能。利用Perl腳本取得其同源序列兩端各150 bp的序列,根據(jù)獲得的序列利用Clustal W進(jìn)行序列對(duì)齊后,發(fā)現(xiàn)其中有SSR的插入和缺失的變異,如圖3所示。利用這些體細(xì)胞突變序列來(lái)區(qū)分柑橘芽變材料時(shí),可能會(huì)提供更多的多態(tài)信息,從而有助于芽變材料的鑒定。
為此,針對(duì)這些在溫州蜜柑全基因組上存在較多同源序列的位點(diǎn)進(jìn)行了PCR引物設(shè)計(jì),不僅在全基因組上能夠同時(shí)對(duì)多個(gè)位點(diǎn)進(jìn)行靶向擴(kuò)增,且SSR的覆蓋程度更高,SSR的多態(tài)性更高,這樣使得測(cè)序文庫(kù)的構(gòu)建效率更加高效。
從53對(duì)SSR引物中篩選出4對(duì)擴(kuò)增效果及重復(fù)性較好、條帶清晰、多態(tài)性較高的引物用于22份柑橘材料的分析。4個(gè)引物共獲得46個(gè)等位條帶,每個(gè)位點(diǎn)的平均等位基因?yàn)?1.913,平均期望雜合率為0.2056,平均PIC值為0.1718。圖4為9號(hào)引物的擴(kuò)增效果圖。
從丙烯酰胺凝膠電泳結(jié)果來(lái)看,4份引物區(qū)分芽變材料的能力均較強(qiáng),獲得的帶型較多,可用于芽變材料的基因分型。在22份材料中共產(chǎn)生多態(tài)性條帶84條,平均每對(duì)引物檢測(cè)到6.11個(gè)多態(tài)性位點(diǎn)。對(duì)比9#母本和3#變異的擴(kuò)增效果圖發(fā)現(xiàn),9號(hào)引物、30號(hào)引物和53號(hào)引物均能擴(kuò)增出差異性條帶,在圖譜中不僅有較多新條帶的出現(xiàn),也發(fā)現(xiàn)了部分親本條帶的缺失。
根據(jù)22份柑橘材料的基因型,采用GenAlEx 6.51軟件進(jìn)行 PCoA主坐標(biāo)軸分析,可明顯將一些早熟芽變材料3、9、7、8、10、11、12號(hào)等區(qū)分開(kāi)(圖5),這些材料位于第一坐標(biāo)軸的右側(cè),與中晚熟材料能夠明顯地區(qū)分開(kāi)。
為驗(yàn)證SSR引物擴(kuò)增結(jié)果的穩(wěn)定性和可靠性,取差異條帶進(jìn)行割膠回收后進(jìn)行Sanger測(cè)序。9號(hào)引物的9#1、9#9、9#17等多個(gè)克隆的測(cè)序結(jié)果相同,均為同一基因位點(diǎn)。對(duì)基因進(jìn)行注釋,證實(shí)為編碼柑橘雙功能核黃素生物合成蛋白 RIBA 1的基因,NCBI參考序列為XM_006492553.2,GenBank編號(hào)為NW_006257091.1。根據(jù)基因序列重新設(shè)計(jì)正義引物(5′-GGGATTGCCTGTTGACTC-3′),反義引物(5′-GTTTGAATTGCTGCTTATGT-3′)再次進(jìn)行擴(kuò)增,擴(kuò)增得到單一條帶,沒(méi)有擴(kuò)增出條帶的為變異株(圖6),結(jié)果與9號(hào)引物的擴(kuò)增結(jié)果吻合。
為驗(yàn)證從溫州蜜柑基因組上挖掘到的 SSR位點(diǎn)在區(qū)分柑橘芽變材料上的有效性,選擇2個(gè)溫州蜜柑的芽變材料3號(hào)和7號(hào),利用77對(duì)SSR引物進(jìn)行多路復(fù)用靶向擴(kuò)增來(lái)構(gòu)建測(cè)序文庫(kù),之后在 Illumina Miseq測(cè)序平臺(tái)上進(jìn)行測(cè)序,測(cè)序數(shù)據(jù)經(jīng)過(guò)質(zhì)量控制并去除接頭后,分別獲得40.725 M和38.559 M的短讀序列。
利用NextGENe_v2.4.3與克里曼丁紅橘參考基因組進(jìn)行對(duì)比后,3號(hào)共鑒定到1 208個(gè)與克里曼丁紅橘基因組存在差異的變異位點(diǎn),平均測(cè)序深度為273.12,最高測(cè)序深度為7 955。7號(hào)材料共鑒定到1 202個(gè)變異位點(diǎn),平均測(cè)序深度為 269.57,最高測(cè)序深度為6 366。利用兩份材料的vcf文件,采用vcftools提取兩個(gè)文庫(kù)中各個(gè)位點(diǎn)的測(cè)序深度 DP、等位基因頻率AF、等位基因覆蓋度SGACOV以及插入及重復(fù)序列,通過(guò)數(shù)據(jù)庫(kù)中等位基因頻率AF和測(cè)序深度的比對(duì),可尋找到能夠區(qū)分芽變材料的重要分子標(biāo)記。足夠的測(cè)序深度使SSR和SNP的鑒定更為準(zhǔn)確可靠。在測(cè)序深度較高的序列中或者附近往往含有SSR位點(diǎn),并且兩個(gè)芽變材料的最高測(cè)序深度均對(duì)應(yīng)在相同的SCAFFOLD位置上,比如在測(cè)序深度較高的SCAFFOLD_2上的9 464 527—9 464 586位置含有GAA重復(fù),SCAFFOLD_6上23 400 572—23 400 596含有TTA重復(fù),表明從短讀序列cluster的測(cè)序深度的分布上,能夠確定擴(kuò)增產(chǎn)物的主帶及其位置。從而通過(guò)測(cè)序深度,可以獲得多個(gè)位置SSR的基因型,實(shí)現(xiàn)了同時(shí)對(duì)多位點(diǎn) SSR的基因分型。對(duì)相同位點(diǎn)上SSR等位基因的統(tǒng)計(jì),可發(fā)現(xiàn)在一個(gè)位點(diǎn)上存在多個(gè)等位基因的現(xiàn)象,這為芽變品種的鑒定提供了更多的可選擇標(biāo)記。
通過(guò)數(shù)據(jù)庫(kù)中測(cè)序深度DP、等位基因頻率AF、等位基因覆蓋度 SGACOV以及插入及重復(fù)序列的對(duì)比,發(fā)現(xiàn)在SCAFFOLD_6和SCAFFOLD_2兩個(gè)位置上存在顯著的SSR差異(表3),進(jìn)一步用IGV審視后發(fā)現(xiàn)在SCAFFOLD_6的23 400 572—23 400 596上和SCAFFOLD_2位置9 464 550—9 464 651上有重復(fù)單元的插入或缺失差異,另外在SSR位點(diǎn)的側(cè)翼也存在SNP變異(圖7、圖8)。通過(guò)深度測(cè)序,不僅驗(yàn)證了 Target-SSR測(cè)序技術(shù)在區(qū)分芽變材料上的有效性,同時(shí)能夠?qū)SR進(jìn)行精準(zhǔn)的基因分型和定位,尤其是對(duì)SSR中插入或缺失的重復(fù)單元差異數(shù)目進(jìn)行精確的鑒定。
表3 2個(gè)柑橘芽變材料的SSR和SNP基因型差異比較Table 3 The differentiation SSR and SNP variation on two citrus bud sports variants
通過(guò)對(duì)兩個(gè)溫州蜜柑芽變 VCF變異數(shù)據(jù)的比對(duì)發(fā)現(xiàn),測(cè)序深度在600以上的差異位點(diǎn)在2個(gè)芽變品種中僅有3個(gè),其中一個(gè)位于SCAFFOLD_6的23 400 572—23 400 596上,另外一個(gè)位于SCAFFOLD_2位置9 464 550—9 464 651上和5 693 245—5 693 275上。而減少測(cè)序深度的篩選條件,則可以得到更多的差異位點(diǎn),但在結(jié)果的可靠性上存疑。這進(jìn)一步證實(shí)了利用常規(guī)SSR技術(shù)來(lái)檢測(cè)芽變的效率確實(shí)不高。在2個(gè)芽變品種中,通過(guò)Target-SSR測(cè)序獲得的變異位點(diǎn)并不多,為進(jìn)一步提高芽變品種的分辨力,可以利用更多的SSR引物來(lái)進(jìn)行靶位點(diǎn)的擴(kuò)增建庫(kù)。
芽變選種是柑橘品種選育的重要途徑之一,植物形態(tài)學(xué)上的差異往往是芽變鑒定的重要標(biāo)記。但在區(qū)分芽變材料時(shí),由于外界環(huán)境條件的改變或者受表觀遺傳因素的影響,常導(dǎo)致植物形態(tài)特征出現(xiàn)較大差異,以形態(tài)特征差異來(lái)區(qū)分芽變,其可靠性和準(zhǔn)確性不高,需要進(jìn)一步開(kāi)展遺傳特異性、穩(wěn)定性和一致性觀測(cè),來(lái)確定變異的可靠性,而這樣往往會(huì)花費(fèi)較長(zhǎng)時(shí)間。分子標(biāo)記技術(shù)作為芽變材料鑒定的輔助手段,在芽變選種中已得到廣泛應(yīng)用。其中SSR標(biāo)記由于穩(wěn)定性高、重復(fù)性好、數(shù)量豐富、呈共顯性遺傳、高多態(tài)性、易于自動(dòng)化檢測(cè),在芽變材料鑒定、品種區(qū)分、品種權(quán)保護(hù)、遺傳多態(tài)性研究、遺傳圖譜構(gòu)建等多個(gè)方面得到廣泛應(yīng)用。SSR在用于芽變材料檢測(cè)時(shí),缺點(diǎn)是SSR所能提供的遺傳多態(tài)性水平不高,往往需要對(duì)大量的SSR引物進(jìn)行篩選,用常規(guī)的聚丙烯酰胺凝膠電泳有時(shí)難以找到可區(qū)分標(biāo)記,且由于聚丙烯酰胺凝膠電泳的分辨率限制,不能準(zhǔn)確區(qū)分SSR擴(kuò)增產(chǎn)物堿基個(gè)數(shù)的微小差異,偶爾也會(huì)產(chǎn)生假陽(yáng)性或假陰性結(jié)果。而以往采用區(qū)分柑橘芽變材料的 AFLP技術(shù),又存在讀帶困難、自動(dòng)化程度低、耗時(shí)費(fèi)力等問(wèn)題,尤其區(qū)分遺傳背景高度相似的柑橘品種,如區(qū)分臍橙[3,11]、溫州蜜柑[11]、冰糖橙等芽變材料時(shí),也存在多態(tài)性低而不能有效區(qū)分芽變材料的相同問(wèn)題。比如,李益等[11]利用SSR開(kāi)展柑橘品種鑒定,從362對(duì)引物中篩選出21對(duì)SSR核心引物,盡管通過(guò)增加引物對(duì)組合可提高品種的區(qū)分能力,但仍有 279個(gè)品種無(wú)法單獨(dú)一一區(qū)分,雖可劃分為87個(gè)小組,但組內(nèi)品種無(wú)法區(qū)分。羅靜等[6]利用RAPD標(biāo)記對(duì)25份柑橘資源及其芽變系進(jìn)行鑒定和多樣性分析,RAPD的多態(tài)性檢出率只有50.7%。在其他果樹(shù)上也存在類似問(wèn)題。在桃芽變株系的鑒定中,通過(guò)50對(duì)SSR檢測(cè),只有對(duì)照C2在CP-PCT022和BPPCT023標(biāo)記上出現(xiàn)了與供試樣品不同的等位基因位點(diǎn)[30];在梨的芽變檢測(cè)中,10對(duì)EST-SSR引物在4組材料中沒(méi)有擴(kuò)增出差異條帶,不能鑒別芽變材料[31],說(shuō)明利用常規(guī)手段采用多態(tài)性水平較低的SSR標(biāo)記來(lái)區(qū)分鑒定芽變材料,其效率并不高。
要克服這個(gè)問(wèn)題,一個(gè)辦法是選用基因組上變異熱點(diǎn)區(qū)域中多態(tài)性較高的SSR進(jìn)行相關(guān)區(qū)域的擴(kuò)增,另一個(gè)辦法就是增加 SSR的檢測(cè)位點(diǎn)數(shù)量。利用下一代測(cè)序技術(shù)開(kāi)展SSR基因分型是目前新興的技術(shù),按照文庫(kù)構(gòu)建方法的差異可分為T(mén)arget SSR-seq[21]和AmpSeq-SSR[32]兩類。Target SSR-seq是在構(gòu)建文庫(kù)前對(duì)已有的SSR進(jìn)行篩選,確定目標(biāo)SSR后建庫(kù)測(cè)序。YANG等[21]利用122個(gè)SSR通過(guò)Target SSR-seq技術(shù)對(duì)382個(gè)黃瓜品種進(jìn)行基因分型,獲得16個(gè)核心引物用于黃瓜品種鑒定。AmpSeq-SSR是一種大規(guī)模SSR-seq方法,它通過(guò)設(shè)計(jì)可多重?cái)U(kuò)增的AmpliSeq引物,使用專用的AmpliTaq酶擴(kuò)增,理論上可同時(shí)擴(kuò)增上百萬(wàn)個(gè)位點(diǎn),但其引物設(shè)計(jì)要求高、價(jià)格貴。LI等[32]利用3 105個(gè)SSR通過(guò)AmpSeq-SSR技術(shù)構(gòu)建水稻的指紋圖譜。Target SSR-seq相對(duì)于AmpliSeq在小規(guī)模 SSR基因分型應(yīng)用上成本更低,但其操作更加繁瑣,需對(duì)每個(gè) SSR位點(diǎn)單獨(dú)擴(kuò)增。本研究所使用Target SSR-seq技術(shù)在引物設(shè)計(jì)上結(jié)合了Target SSR-seq和AmpSeq-SSR兩種方法的優(yōu)點(diǎn),首先通過(guò)對(duì)芽變近似材料基因組的掃描和同源序列比對(duì),來(lái)獲得基因序列中同源相似度高、匹配數(shù)量多、多態(tài)性高的SSR位點(diǎn)。這些SSR位點(diǎn)在基因組上的匹配度高,一方面說(shuō)明其在基因組上的分布廣,有可能存在高度重復(fù),因而變異的可能性就更大,相應(yīng)的 SSR多態(tài)性指數(shù)也就提高了。利用其側(cè)翼序列來(lái)設(shè)計(jì)引物,不僅能大幅減少引物的設(shè)計(jì)數(shù)量,同時(shí)又能保證 SSR的多態(tài)性水平;另一方面,若這些變異的 SSR來(lái)自于同一個(gè)位點(diǎn),且多態(tài)性水平高,表明存在復(fù)等位基因,在同一材料中存在這種復(fù)等位變異,就證明了有部分細(xì)胞產(chǎn)生了變異,從而為芽變形態(tài)的發(fā)生奠定了基礎(chǔ)。
一般情況下,SSR在整個(gè)基因組上均有分布,但近年來(lái)利用基因組序列開(kāi)展SSR鑒定時(shí),發(fā)現(xiàn)在不同染色體上的SSR數(shù)量并不是均勻分布[33-35]。在禾本科不同種類植物中,SSR在基因組上的分布密度在種間存在較大差異[34],著絲粒附近的密度往往小于染色體臂上的密度,非編碼區(qū)(UTRs)SSR的覆蓋率比編碼區(qū)、外顯子區(qū)和內(nèi)含子區(qū)更高,SSR的豐度與重組率呈顯著的線形正相關(guān)[34]。為提高SSR區(qū)分芽變品種的能力,往往需要篩選多態(tài)性高的SSR用于靶向測(cè)序,本研究通過(guò)同源序列的比較,以發(fā)現(xiàn)匹配數(shù)量多且多態(tài)性水平高的SSR位點(diǎn),進(jìn)而設(shè)計(jì)引物。這與以往通過(guò)基因組序列來(lái)鑒定 SSR位點(diǎn)有本質(zhì)區(qū)別,以往SSR的生物信息學(xué)挖掘只是對(duì)SSR位點(diǎn)和模式的鑒定,缺少同源序列的比較,因此不能提供SSR多態(tài)性方面的信息。本研究利用BLASTn發(fā)現(xiàn)了一些在基因組上同源匹配數(shù)量很高的SSR序列,表明這些SSR位點(diǎn)來(lái)自于序列重復(fù)區(qū)域或者是變異熱點(diǎn)區(qū)域,這些位點(diǎn)除了與基因組上的多次復(fù)制事件有關(guān)外,還可能與染色體的多次重排事件有關(guān),因此這些SSR能夠提供更多的遺傳變異信息,因此有助于芽變材料的鑒定。MA等[33]采用對(duì)4個(gè)物種基因組開(kāi)展SSR引物的e-PCR比較,來(lái)評(píng)價(jià)不同物種之間SSR的多態(tài)性和SSR產(chǎn)物在物種之間的特異性,顯著提高了SSR引物區(qū)分不同物種的能力。
本研究利用溫州蜜柑和克里曼丁橘全基因組序列發(fā)掘SSR位點(diǎn),發(fā)現(xiàn)在基因組上AT/TA二單元是最多的串聯(lián)重復(fù),而3基序中以AAT最多,這與PAVAN KUMAR等[36]在葉子花中的結(jié)果相似。利用同源序列比對(duì)的方式來(lái)獲得多態(tài)性SSR位點(diǎn),采用在全基因組序列中同源比對(duì)匹配度高、數(shù)量多的SSR位點(diǎn)的側(cè)翼序列來(lái)設(shè)計(jì)引物,共設(shè)計(jì)了53對(duì)引物,篩選到能夠區(qū)分芽變材料的4對(duì)引物,其效率比其他方式利用SSR來(lái)區(qū)分柑橘芽變材料的效率更高。4對(duì)引物就可對(duì)22份柑橘種質(zhì)材料進(jìn)行有效區(qū)分,并且對(duì)有差異性的條帶進(jìn)行回收和Sanger測(cè)序,進(jìn)一步證實(shí)了這些引物在區(qū)分柑橘品種上的可靠性、穩(wěn)定性及分辨能力,同樣這些引物還能夠用于柑橘其他種類及品種的區(qū)分和鑒定。本研究中Target-SSR Miseq的測(cè)序結(jié)果也證實(shí),在測(cè)序深度較高的擴(kuò)增位點(diǎn)中,往往存在多個(gè)SSR等位基因,這些等位基因有可能來(lái)自于基因組上的不同位點(diǎn),代表著基因的復(fù)制或者跳躍事件,有一定的生物學(xué)功能;也有可能來(lái)自于基因組上的同一位點(diǎn),若是存在于同一位點(diǎn)上的復(fù)等位基因,則暗示有個(gè)別細(xì)胞產(chǎn)生了變異從而形成混合的細(xì)胞亞群,因此根據(jù)不同SSR等位基因的比例差異,能夠?qū)崿F(xiàn)柑橘芽變品種的區(qū)分。
另外,增加 SSR的檢測(cè)位點(diǎn)數(shù)量,也能有效提高鑒別區(qū)分芽變材料的能力。本研究采用靶位點(diǎn)的多路復(fù)用擴(kuò)增來(lái)構(gòu)建測(cè)序文庫(kù),通過(guò)18個(gè)組合,對(duì)2個(gè)溫州蜜柑芽變材料采用 77對(duì) SSR進(jìn)行了有效擴(kuò)增,構(gòu)建了測(cè)序文庫(kù),并采用Illumina Miseq的深度測(cè)序一次性獲得了1 202—1 208個(gè)變異位點(diǎn),平均每對(duì)引物獲得了 15.6個(gè)變異位點(diǎn),顯著高于凝膠電泳的檢測(cè)能力。并且能對(duì)變異位點(diǎn)獲得了準(zhǔn)確的基因分型,同時(shí)還可獲得SSR側(cè)翼的SNP基因型,進(jìn)一步提高信息量和芽變材料的鑒定能力。該方法還克服了凝膠電泳存在的讀帶困難,可組合的SSR基因座的個(gè)數(shù)受熒光種類限制,檢測(cè)的變異位點(diǎn)少,一次難以進(jìn)行多個(gè) SSR位點(diǎn)的基因分型的問(wèn)題。YANG等[21]利用 Target-SSR測(cè)序開(kāi)展黃瓜品種的SSR基因分型,表明該技術(shù)不僅經(jīng)濟(jì)高效,測(cè)序深度較高(~1 000×),同時(shí)基因分型的成功率高達(dá)100%。利用群體材料進(jìn)行SSR基因分型時(shí),發(fā)現(xiàn)SSR位點(diǎn)上的等位基因數(shù)量與觀察雜和度、PIC值呈顯著正相關(guān)。在進(jìn)行 SSR基因分型開(kāi)展黃瓜遺傳群體的劃分時(shí),作者采用了遺傳多樣性高而等位基因數(shù)最少的SSR位點(diǎn)用于基因分型。而本研究中Target-SSR測(cè)序技術(shù)主要用于2個(gè)芽變材料的區(qū)分,因此采用遺傳多態(tài)性高而等位基因數(shù)較多的SSR,能夠顯著提高芽變材料的鑒別能力。
本研究中 Target-SSR深度測(cè)序的結(jié)果表明,2份溫州蜜柑芽變材料間的SSR基因型至多在3個(gè)等位基因上出現(xiàn)了差異,有差異的 SSR位點(diǎn)數(shù)并不多。這一方面印證了SSR技術(shù)區(qū)分柑橘芽變的能力有限,另一方面也表明通過(guò)PCR擴(kuò)增建庫(kù),由于引物的特異性強(qiáng),建庫(kù)較為成功。對(duì)于同一位點(diǎn)SSR基因型中3等位基因的出現(xiàn),還需要進(jìn)一步區(qū)分是否存在基因組上的多位點(diǎn)擴(kuò)增。只有通過(guò)測(cè)序深度、等位基因覆蓋度、等位基因頻率等多個(gè)指標(biāo)的結(jié)合,才能更精準(zhǔn)地發(fā)現(xiàn)芽變導(dǎo)致的SSR位點(diǎn)差異。由于這些有差異的SSR位點(diǎn)往往來(lái)源于體細(xì)胞變異而非胚性變異,因此存在變異細(xì)胞數(shù)量少,在測(cè)序深度低、PCR擴(kuò)增建庫(kù)存在偏向性時(shí),這種一個(gè)位點(diǎn)上存在多等位基因變異的現(xiàn)象,往往難以被檢測(cè)到。本研究為提高柑橘芽變品種的區(qū)分能力,在進(jìn)行 SSR靶位點(diǎn)的深度測(cè)序前,使用了較多數(shù)量的SSR引物進(jìn)行多路復(fù)用靶位點(diǎn)PCR擴(kuò)增,增加了檢測(cè)位點(diǎn)數(shù)量,同時(shí)選用覆蓋度高、同源序列多、多態(tài)性高的SSR位點(diǎn)進(jìn)行引物設(shè)計(jì),使文庫(kù)構(gòu)建更加高效,也更加容易發(fā)現(xiàn)芽變材料中的突變位點(diǎn)。深度測(cè)序結(jié)果不僅準(zhǔn)確探明了芽變材料的 SSR基因型,同時(shí)也定位了SSR在基因組上的位置,利用SSR的測(cè)序深度和等位基因頻率兩個(gè)參數(shù)結(jié)合,發(fā)現(xiàn)了在芽變材料間具有差異的SNP和SSR位點(diǎn),從而實(shí)現(xiàn)了芽變材料的準(zhǔn)確區(qū)分,也為芽變材料目標(biāo)性狀變異的遺傳機(jī)理研究提供了更多有用信息。鑒于Target-SSR靶位點(diǎn)的深度測(cè)序技術(shù)能夠在24 h內(nèi)對(duì)多個(gè)樣本中的數(shù)百個(gè)目標(biāo)SSR位點(diǎn)進(jìn)行快速基因分型,不僅成本更低,而且發(fā)掘變異的能力更強(qiáng),未來(lái)還可通過(guò)進(jìn)一步增加SSR擴(kuò)增靶位點(diǎn)的數(shù)量來(lái)提高芽變材料的鑒別能力。該技術(shù)除了用于芽變材料的鑒定外,一次能夠獲得覆蓋全基因組的大量位點(diǎn)的SSR基因型,更有利于柑橘資源的遺傳演化及多樣性研究。
本研究采用基因組數(shù)據(jù)庫(kù)挖掘和比對(duì),發(fā)掘突變熱點(diǎn)位置的SSR,利用優(yōu)選出的靶位點(diǎn)SSR設(shè)計(jì)引物進(jìn)行多路擴(kuò)增構(gòu)建測(cè)序文庫(kù),采用 Miseq二代測(cè)序技術(shù),成功鑒定了溫州蜜柑的芽變材料及其親本,同時(shí)對(duì)玉溪地區(qū)的22份優(yōu)異柑橘材料進(jìn)行了多樣性研究。本研究綜合了芽變檢測(cè)的兩種技術(shù),選用來(lái)源于變異熱點(diǎn)的多態(tài)性較高的SSR位點(diǎn)進(jìn)行擴(kuò)增構(gòu)建測(cè)序文庫(kù),增加SSR的檢測(cè)位點(diǎn)數(shù)量,并基于深度測(cè)序技術(shù)獲得了精準(zhǔn)的SSR靶位點(diǎn)及其基因型,為今后的柑橘芽變品種鑒定、資源遺傳多樣性研究奠定了重要基礎(chǔ)。