屠德鵬,魏臻武,武自念,雷艷芳,張 棟,邱偉偉
(1.揚州大學動物科學與技術(shù)學院 揚州大學草業(yè)科學研究所,江蘇 揚州 225009; 2.上海鼎牛飼料有限公司,上海 200436)
隨著分子生物學、基因組學和功能基因組學的快速發(fā)展,分子標記技術(shù)的應(yīng)用也越來越廣泛[1-3]。苜蓿(Medicagosativa)分子標記輔助育種是加速苜蓿育種進程的重要手段之一。魏臻武[4]利用SSR、ISSR、RAPD標記技術(shù)構(gòu)建了苜蓿的指紋圖譜,指紋圖譜可以鑒定苜蓿品種、品系和選擇雜交親本,為育種工作提供保障。在眾多的分子標記中,SSR(simple sequence repeat)標記以含量豐富、遍布整個基因組、共顯性、多態(tài)性高等優(yōu)點被廣泛應(yīng)用[5-7]。傳統(tǒng)SSR引物開發(fā)一般是通過構(gòu)建基因組文庫、Southern雜交、基因克隆和測序等程序進行的,該方法工作量大、成功率低且成本較高[5]。
蒺藜苜蓿(M.truncatula)作為豆科模式植物,具有遺傳轉(zhuǎn)化效率高、生長期短、基因組小、自花授粉、固氮等優(yōu)點[8-10]。蒺藜苜蓿與苜蓿親緣關(guān)系很近,與苜?;蚪M具有很高的同源性。因而從蒺藜苜蓿獲得的信息可以用于苜蓿中,這對于促進豆類作物和苜蓿等牧草的育種有重要意義。隨著對蒺藜苜?;蚪M學的深入研究,SSR標記已不能滿足蒺藜苜蓿高密度遺傳圖譜構(gòu)建、基因克隆等研究的需要。因此,需要開發(fā)大量新的標記。
表達序列標簽(expressed sequence tags,EST)是指從不同組織來源的cDNA文庫中隨機挑選克隆進行5′或3′端測序后得到的長約300~500 bp的基因表達序列片段[11-12]。EST-SSRs是基于EST的新型分子標記,EST-SSRs與基因組SSR標記相比不但具有可以直接獲得基因表達信息,為功能基因提供可靠標記的優(yōu)點,而且具有通用性高、開發(fā)簡單且成本較低等優(yōu)點[13]。在小麥(Triticumaestivum)[14]、大豆(Glycinemax)[15]、苜蓿[4,16]、高羊茅(Festucaarundinacea)[13]、鴨茅(Dactylisglomerata)[17]、鷹嘴豆(Cicerarietinum)[18]、高粱(Sorghumbicolor)[19-20]等植物的EST序列中檢測到2%~10%的EST-SSRs。從而可見,EST中含有大量的SSR,為SSR標記的開發(fā)提供了一個巨大的DNA序列來源。目前,NCBI上公布的蒺藜苜蓿EST已達285 285條,大量EST的存在為蒺藜苜蓿EST-SSRs標記的開發(fā)奠定了基礎(chǔ)。
該試驗利用NCBI上公布的蒺藜苜蓿EST序列,查找EST-SSRs,分析SSR在蒺藜苜蓿EST中的分布特征。設(shè)計EST-SSRs引物,利用蒺藜苜蓿重組自交系 (RIL)群體及其親本進行電泳檢測,開發(fā)新的EST-SSRs標記。這些新的EST-SSRs標記,為蒺藜苜蓿高密度遺傳圖譜的構(gòu)建、遺傳多樣性、基因克隆、數(shù)量性狀基因位點(QTL)定位及引物通用性等方面的研究提供材料來源。
1.1材料 試驗材料為來自法國的蒺藜苜蓿Jemalong中的A20和A17構(gòu)建的RIL-8群體及親本,該群體目前有143個家系。群體和親本2009年10月種植在揚州大學草業(yè)科學實驗基地,試驗地土壤肥力中等偏上,有機質(zhì)含量為1.2%,全氮含量0.12%,堿解氮100.4 mg/kg,速效磷88.7 mg/kg,速效鉀36.3 mg/kg。條播,行距0.7 m,小區(qū)面積為1 m×2 m。全年不施肥。適時排灌水,人工除草。
1.2方法
1.2.1DNA的提取 采用魏臻武[4]稍加改進的CTAB法提取基因組DNA。用0.8%瓊脂糖凝膠和紫外分光光度計對其質(zhì)量和濃度進行檢測。提取的DNA溶解于100 μL TE后放入4℃冰箱備用。
1.2.2蒺藜苜蓿EST序列中SSR的檢索 從NCBI(http://www.ncbi.nlm.nih.gov/)網(wǎng)上下載285 285條蒺藜苜蓿EST序列。利用SSRIT(simple sequence repeat identification tool)軟件檢索重復單元為二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的SSR,標準為重復序列長度≥20 bp,即二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸重復次數(shù)分別大于或等于10、7、5、4、4。
1.2.3EST-SSRs引物設(shè)計 利用Primer Premier 5.0軟件進行引物設(shè)計,引物設(shè)定的條件如下:引物長度范圍為18~22 bp;引物退火溫度在50~60℃,上下引物退火溫度相差不超過2℃;GC含量在40%~60%,最佳為50%,且上下引物序列GC含量的差異不能太大,3′端最后5個堿基最好不要富含GC,特別是連續(xù)的3個G或C;擴增產(chǎn)物在100~600 bp;盡量避免形成穩(wěn)定的引物二聚體(dimer and cross dimer)和發(fā)夾結(jié)構(gòu)(hairpin)。設(shè)計的引物由上海英駿生物技術(shù)有限公司合成。
1.2.4SSR擴增反應(yīng)體系 DNA模板(20~90 ng/μL)3 μL;引物(10 pmol/μL)3 μL;反應(yīng)體系混合物配比:0.24 μL dNTP (10 mmol/L) +1.5μL 10×Buffer + 0.9 μL Mg2+(20 mmol/L) + 0.16 μL TaqDNA聚合酶(1U) +1.2 μL ddH2O[11]。反應(yīng)體系為10 μL(每孔添加量)。
擴增反應(yīng)程序:94℃預(yù)變性3 min,95℃變性1 min,52℃退火1.5 min(不同引物退火溫度不同),72℃延伸1 min,共循環(huán)35次,最后72℃保溫8 min,4℃保存。
1.2.5凝膠電泳及銀染 PCR擴增產(chǎn)物中加入1 μL Loading buffer(溴酚藍緩沖液),擴增產(chǎn)物用8%非變性聚丙烯酰胺凝膠(PAGE)電泳,150 V恒電壓,然后銀染檢測,拍照保存。
2.1蒺藜苜蓿EST-SSRs的檢索 從285 285條EST序列中共檢測SSR序列6 688條,分布于6 512個EST序列中。EST-SSRs占所有EST總數(shù)的2.28%,其中二、三、四、五和六核苷酸重復基元分別占總SSR的34.4%、29.6%、10.2%、11.8%和14.0%,二核苷酸和三核苷酸出現(xiàn)頻率最高,四核苷酸重復基元出現(xiàn)的頻率最低,為10.2%(表1)。
表1 EST-SSRs序列中不同重復核苷酸數(shù)的數(shù)量及百分比
2.2蒺藜苜蓿EST-SSRs的分布特征 在檢測到的2 301條含有二核苷酸重復基元的EST-SSRs中,含GA/TC和AG/CT重復基元最多,分別占SSRs總數(shù)的17.49%(1 170條)和11.21%(55條)(圖1);其中CG/CG重復基元沒有出現(xiàn)。三核苷酸重復基元中以GAA/TTC出現(xiàn)的頻率最高,為7.10%;其次是AAG/CTT、AGA/TCT、ATG/CAT和AAT/ATT,占總SSRs比例分別為4.28%、3.75%、1.67%和1.50%,其他重復基元出現(xiàn)的頻率較低。四核苷酸、五核苷酸和六核苷酸出現(xiàn)頻率較高的為AATT/AATT(1.58%)、CTCA/TGAG(1.48%)、AAATC/GATTT(0.57%)和TCTAAA/TTTAGA(1.06%)。其余各重復基元頻率都較低。
對于重復次數(shù),二核苷酸基元的重復次數(shù)類型多、跨度大。其中GA/TC基元跨度最大,達72種,重復次數(shù)為10~87次;其次為AG/CT基元,跨度為47種,重復次數(shù)為10~79次;AT/AT和TA/TA基元跨度也較大,重復次數(shù)分別為10~34和10~37。三核苷酸基元重復次數(shù)類型和跨度比二核苷酸小,其中GAA/TTC(11種)、AGA/TCT(8種)、 AAG/CTT(7種)和ACT/AGT(6種),其他重復基元的重復次數(shù)多以7、8、9次出現(xiàn)。四核苷酸中ATAG/CTAT(4種)和CTCA/TGAG(4種)跨度較大,其他類型重復次數(shù)多以4、5次出現(xiàn)。五核苷酸和六核苷酸重復基元的重復次數(shù)多以4、5、6次中的一種或兩種出現(xiàn)(表2)。
圖1 蒺藜苜蓿EST-SSRs主要重復基元分布圖
表2 蒺藜苜蓿EST-SSRs各基元類型的重復次數(shù)分布
2.3蒺藜苜蓿EST-SSRs電泳篩選結(jié)果 利用Primer Premier 5.0軟件對6 688條EST-SSRs進行引物設(shè)計,去除重復等不合適的引物共設(shè)計出3 090對,隨機選取100對引物合成,以RIL-8群體親本A17和A20的DNA為模板進行擴增、篩選,篩選出多態(tài)性的引物在RIL-8群體中擴增、電泳(圖2)。在A17和A20上有清晰條帶為85對,占所設(shè)計引物比例的85%。其中有多態(tài)性的引物29對(表3),占34.1%(圖3)。多態(tài)性引物均能在RIL-8群體中擴增出穩(wěn)定的產(chǎn)物。
圖2 MES028在部分蒺藜苜蓿RIL-8群體上的電泳圖
表3 29對蒺藜苜蓿EST-SSRs多態(tài)性引物
圖3 MES001~MES024在蒺藜苜蓿A17和A20上的電泳圖
3.1EST-SSRs的分布特征 在小麥[14]、大豆[15]、萵苣(Lactucasativa)[21]等大多數(shù)植物的EST-SSRs中發(fā)現(xiàn),三核苷酸重復出現(xiàn)的頻率比二核苷酸重復高。而在本研究中EST-SSRs的分布二核苷酸基元(34.4%)略大于三核苷酸基元(29.6%)。在鵝掌楸(Liriodendronchinense)[22]、芝麻(Sesamumindicum)[23]、砂梨(Pyruspyrifolia)[24]等中也得到了同樣的結(jié)論。這可能是與本研究中檢索SSR的標準為重復序列≥20 bp有關(guān)。Thiel等[25]的研究結(jié)果中顯示18 bp長度時,三核苷酸重復基元出現(xiàn)的頻率高于二核苷酸重復基元。大多數(shù)作物中二核苷酸重復基元以GA/TC出現(xiàn)的頻率最高,而CG/CG重復基元出現(xiàn)的頻率最低,如水稻(Oryzasativa)、玉米(Zeamays)、大豆、高粱等[26-27]。本試驗中GA/TC出現(xiàn)的頻率是最高的,而CG/CG沒有出現(xiàn),該結(jié)論與大多數(shù)植物的研究結(jié)果一致。不同植物三核苷酸重復基元主要的重復類型變化較大,小麥以AAC/GTT出現(xiàn)的頻率最高[14],大麥(Hordeumvulgare)、玉米、水稻和高粱中則出現(xiàn)的頻率最高是GGC/GCC[28];鵝掌楸中是以AAG/CTT重復基元出現(xiàn)頻率較高,占三核苷酸重復基元的40.2%[22](表4);本研究檢測到的1 982條三核苷酸重復基元中GAA/TTC出現(xiàn)的頻率最高,為475條,占總檢測SSR的7.1%,占三核苷酸重復基元的24%,本研究結(jié)論與在大豆上的檢測結(jié)果是一致的[15]。
3.2EST-SSRs標記的開發(fā) 隨著分子標記和測序技術(shù)的快速發(fā)展,EST-SSRs的應(yīng)用也越來越普遍,為EST-SSRs標記的開發(fā)提供了廣闊的前景。截至到2010年6月11日,從NCBI中的dbEST數(shù)據(jù)庫中蒺藜苜蓿的EST序列已達到285 285條,與2002年12月31日的147 000條EST相比,增加了將近一倍。目前,在多種作物中EST-SSRs都展開了研究,陳海梅等[14]在小麥的EST中檢測到1.34%的序列中含SSR,并將43個EST-SSRs位點繪制到小麥的遺傳圖譜上;常瑋等[15]在大豆的458 220條EST中獲得無冗余的SSR序列8 190條,設(shè)計的200對引物中148對有清晰且單一條帶擴增產(chǎn)物,開發(fā)了148個新的SSR標記。在牧草中EST-SSRs的研究也比較普遍,Eujayl等[6]研究蒺藜苜蓿EST-SSRs在苜蓿屬中的通用性,結(jié)果表明74%的EST-SSRs引物在苜蓿屬中有擴增產(chǎn)物;Sim等[29]研究了谷物的EST-SSRs在黑麥草(Loliumspp.)中的通用性,來自谷物的165個EST-SSRs中,57%的EST-SSRs在黑麥草中有擴增產(chǎn)物,且多態(tài)率達67%; Xie等[17]利用50對谷物(玉米、小麥和高粱)的EST-SSRs和15對鴨茅SSR引物對74個鴨茅材料進行護增,其多態(tài)率為84.63%;Simko[21]從萵苣的19 523條EST中檢測到4.5%的EST含有SSR序列(重復序列≥20 bp)。本研究在285 285條EST中檢測到6 512條EST含有SSR序列,SSR序列為6 688條。隨機設(shè)計的100對引物中,在蒺藜苜蓿RIL-8群體親本A17和A20中85對引物有擴增產(chǎn)物,開發(fā)了85個新的SSR標記。具有多態(tài)性的引物為29對。
表4 部分植物出現(xiàn)頻率最高的核苷酸重復基元
1)從NCBI數(shù)據(jù)庫285 285條EST序列中檢測到6 688條SSR序列。占 EST總數(shù)的2.28%,二核苷酸出現(xiàn)頻率最高,其次為三核苷酸,二、三核苷酸占所有核苷酸的64%。四核苷酸分布最少,為10.2%。
2)蒺藜苜?;蚪M中GA/TC和AG/TC重復基元占SSRs總數(shù)的17.49%和11.21%,在各種重復基元中最多。蒺藜苜?;蚪M中CG/CG重復基元沒有出現(xiàn)。
3)利用EST-SSRs序列隨機設(shè)計100對引物,在蒺藜苜蓿RIL-8群體親本A17和A20中擴增、電泳,85對引物具有清晰的擴增條帶,開發(fā)了85個新的SSR標記。具有多態(tài)性的引物為29對。這些EST-SSRs標記可以為蒺藜苜蓿高密度遺傳圖譜的構(gòu)建、遺傳多樣性、基因克隆、QTL定位及引物通用性等方面的研究提供材料來源。
[1] 魏臻武,蓋鈞鎰.豆科模式植物蒺藜苜?;蚪M研究進展[J].中國草地學報,2006,28(6):83-90.
[2] Town C D.Annotating the genome ofMedicagotruncatula[J].Current Opinion in Plant Biology,2006,9:122-127.
[3] Young N D,Udvardi M.TranslatingMedicagotruncatulagenomics to crop legumes[J].Current Opinion in Plant Biology,2009,12:193-201.
[4] 魏臻武.利用SSR、ISSR和RAPD技術(shù)構(gòu)建苜?;蚪MDNA指紋圖譜[J].草業(yè)學報,2004,13(3):62-67.
[5] 陳懷瓊,隋春,魏建和.植物SSR引物開發(fā)策略簡述[J].分子植物育種,2009,7(4):845-851.
[6] Eujayl I,Sledge M K,Wang L,etal.MedicagotruncatulaEST-SSRs reveal cross-species genetic markers forMedicagospp.[J].Theoretical and Applied Genetics,2004,108:414-422.
[7] 謝文剛,張新全,馬嘯,等.中國西南區(qū)鴨茅種質(zhì)遺傳變異的SSR分析[J].草業(yè)學報,2009,4(18):138-146.
[8] 魏臻武,蓋鈞鎰.豆科模式植物——蒺藜苜蓿[J].草業(yè)學報,2008,17(1):114-120.
[9] May G D,Dixon R A.Medicagotruncatula[J].Current Biology,2000,14(5):181-182.
[10] Cook D.Medicagotruncatula——a model in the making[J].Current Opinion in Plant Biology,1999,2:301-304.
[11] 胡松年.基因表達序列標簽[M].杭州:浙江大學出版社,2005.
[12] 王曉娜,盧欣石.表達序列標簽的應(yīng)用現(xiàn)狀及分析方法研究[J].草業(yè)科學,2010,27(5):76-84.
[13] Tehrani M S,Mardi M.Genetic diversity and structure among Iranian tall fescue populations based on genomic-SSR and EST-SSR marker analysis[J].Plant Systematics and Evolution,2009,282:57-70.
[14] 陳海梅,李林志,衛(wèi)憲云,等.小麥EST-SSR標記的開發(fā)、染色體定位和遺傳作圖[J].科學通報,2005,50(20):2208-2216.
[15] ?,|,趙雪,李俠,等.大豆EST-SSR標記開發(fā)及與Genomic-SSR的比較研究[J].中國油料作物學報,2009,31(2):149-156.
[16] Sledge M,Ray I,Mian M A.EST-SSRs for genetic mapping in alfalfa[J].Molecular Breeding of Forage and Turf,2004,12:239-243.
[17] Xie W G,Zhang X Q,Cai H W,etal.Genetic diversity analysis and transferability of cereal EST-SSR markers to orchardgrass (DactylisglomerataL.)[J].Biochemical Systematics and Ecology,2010,38:740-749.
[18] Choudhary S,Sethy N K,etal.Development of chickpea EST-SSR markers and analysis of allelic variation across related species[J].Theoretical and Applied Genetics,2009,118:591-608.
[19] Shiringani A L,Frisch M,Friedt W.Genetic mapping of QTLs for sugar-related traits in a RIL population ofSorghumbicolorL.Moench[J].Theoretical and Applied Genetics,2010,121:323-336.
[20] 李杰勤,王麗華,詹秋文,等.高粱EST-SSR標記的建立及其在蘇丹草中的應(yīng)用初探[J].草業(yè)科學,2010,27(3):112-117.
[21] Simko I.Development of EST-SSR markers for the study of population structure in Lettuce (LactucasativaL.)[J].Journal of Heredity,2009,100(2):256-262.
[22] Xu M,Sun Y G,Li H G.EST-SSRs development and paternity analysis forLiriodendronspp.[J].New Forests,2010,40(3):361-382.
[23] 魏利斌,張海洋,鄭永戰(zhàn),等.芝麻EST-SSR標記的開發(fā)和初步研究[J].作物學報,2008,34(12):2077-2084.
[24] 崔海榮,劉金義,佟兆國,等.砂梨EST-SSR引物開發(fā)及其應(yīng)用[J].西北植物學報,2010,30(8):1551-1556.
[25] Thiel T,Michalek W,Varshney R K,etal.Exploiting EST databases for the development and characterization of gene-derived SSR-markers in barley (HordeumvulgareL.)[J].Theoretical and Applied Genetics,2003,106:411-422.
[26] Li L Z,Wang J J,Guo Y,etal.Development of SSR markers from ESTs of gramineous species and their chromosome location on wheat[J].Progress in Natural Science,2008,18:1485-1490.
[27] Liu Y L,Li Y H,Zhou G A,etal.Development of soybean EST-SSR markers and their use to assess genetic diversity in the subgenus soja[J].Agicultural Sciences in China,2010,9(10):1423-1429.
[28] Kantety R V,Rota M L,Matthews D E,etal.Data mining for simple sequence repeats in expressed sequence tags from barley,maize,rice,sorghum and wheat[J].Plant Molecular Biology,2002,48:501-510.
[29] Sim S C,Yu J K,Jo Y K,etal.Transferability of cereal EST-SSR markers to ryegrass[J].Genome,2009,52:431-437.