胡 盼 仲崇祿 張 勇 姜清彬 陳 羽 陳 珍 韓 強
Khongsak Pinyopusarerk2 Didier Bogusz3
(1.中國林業(yè)科學研究院熱帶林業(yè)研究所,廣州 510520; 2.澳大利亞聯(lián)邦科學與工業(yè)研究組織植物所,阿克頓 2600,澳大利亞; 3.法國發(fā)展研究院(IRD),蒙彼利埃,BP 64501,法國)
木麻黃EST序列中SSR的分布特征及有效SSR標記的篩選
胡 盼1仲崇祿1張 勇1姜清彬1陳 羽1陳 珍1韓 強1
Khongsak Pinyopusarerk2Didier Bogusz3
(1.中國林業(yè)科學研究院熱帶林業(yè)研究所,廣州 510520;2.澳大利亞聯(lián)邦科學與工業(yè)研究組織植物所,阿克頓 2600,澳大利亞;3.法國發(fā)展研究院(IRD),蒙彼利埃,BP 64501,法國)
從NCBI的EST數(shù)據(jù)庫中獲得的木麻黃EST序列共有34 752條,進行拼接后得到全長7 278.578 kb的非冗余序列(Unigene)12 062條,并從中檢索得到分布于353條Unigene的367個SSR位點,SSR檢出率為2.93%,平均分布距離為19.83 kb,包括39種重復基序類型。其中,以二核苷酸和三核苷酸為主要類型,在總SSRs中所占比例分別為57.77%和34.60%;而二核苷酸重復基序中,AG/CT所占比例最高,為93.87%;在三核苷酸重復基序中AAG/CTT所占比例最高,為44.09%。對檢索出的EST-SSR位點設計得到97對引物,其中32對為可有效擴增引物。Blastx分析發(fā)現(xiàn)77.3%的含SSR位點的EST序列與非冗余蛋白序列數(shù)據(jù)庫中功能序列具有同源性,而功能已知的序列中葡萄來源的序列占有最大比例(10.4%)。GO功能分類發(fā)現(xiàn),含有SSR位點的EST序列中有47.3%至少具有1個GO注釋,歸入細胞組分的序列最多,而其中細胞質和細胞核的功能項所占比例較大。
木麻黃;EST;SSR
SSR(Simple Sequence Repeat,SSR)是由2~6個核苷酸為重復單位組成的串聯(lián)重復序列。大量研究表明,SSR廣泛存在于各類物種中,且具有極高的多態(tài)性,是許多遺傳學研究如遺傳多樣性研究[1~4]、構建連鎖圖譜[5~7]、基因圖位克隆[8~9],以及進化學研究[10~12]中廣泛應用并極為有效的標記。然而,傳統(tǒng)的利用基因組DNA文庫中的同源DNA片段開發(fā)SSR標記的過程極為耗時和昂貴,所以迫切需要更有效、經(jīng)濟的開發(fā)SSR標記的方法。自人類基因組計劃啟動以來,公共數(shù)據(jù)庫中表達序列標簽(Expressed Sequence Tags,EST)成百上千倍的增長。這些龐大的EST數(shù)據(jù)成為了開發(fā)SSR標記的新的來源。EST-SSR標記在大量作物研究中發(fā)揮了巨大的作用,如擬南芥(Arabidopsisthaliana),玉米(Zeamays),水稻(Oryzasativa)和小麥(Triticumaestivum)[13~15]。林木遺傳育種研究中,利用EST-SSR標記進行重要的林木經(jīng)濟性狀,如生長、材性和抗病性等的QTL定位和選擇也越來越受到人們重視。在廣泛引種的桉樹遺傳圖譜上就定位了大量的數(shù)量性狀位點,如生長[16~17]、材性[17]和耐寒性[18]。
木麻黃科(Casuarinaceae)植物包括4屬,由86個種和13個亞種組成,為常綠喬木或灌木,天然分布于大洋洲、東南亞和天平洋群島[19]。該樹種具有速生、抗風沙、耐干旱和耐貧瘠等特點,被廣泛引種至熱帶和亞熱帶沿海地區(qū),在沿海防護林生態(tài)體系建設中發(fā)揮著重要作用[20]。目前利用等位酶技術[21]、RAPD[22~23]、AFLP[24~25]和ISSR[26]等分子標記在木麻黃科植物中開展的研究多集中于遺傳多樣性和遺傳結構的分析,本研究通過對公共數(shù)據(jù)庫NCBI中的木麻黃科植物的EST序列進行拼接和注釋,發(fā)掘有效的SSR標記,以期為木麻黃遺傳多樣性分析和重要生態(tài)性狀的定位分析提供參考。
1.1 試驗材料
以中國林科院熱帶林業(yè)研究所(廣州)苗圃內(nèi)2年生木麻黃為材料,采集12個單株的新鮮小枝,根據(jù)改良的CTAB法提取基因組DNA[27]。
1.2 木麻黃EST序列的來源及下載
登陸美國國立生物信息中心網(wǎng)站(http://www.ncbi.nlm.nih,gov/),在dbEST數(shù)據(jù)庫中,采用Entrez檢索系統(tǒng),輸入詞條“Casuarina”來搜索木麻黃的EST序列。在木麻黃科目錄下共有2種,其中包括粗枝木麻黃Casuarinaglauce(34 700),短枝木麻黃Casuarinaequisetifoliasubsp.equisetifolia(52)。截止2013年12月31日,木麻黃EST序列總數(shù)為34 752條。獲得搜索結果后,將所有序列以FASTEN格式下載到本地計算機。
1.3 木麻黃EST序列的預處理
從公共數(shù)據(jù)庫中直接獲得的EST序列包含有一些低質量的較短片段(<100 bp)和帶有少量載體序列及末端帶有polyA/T尾的序列,這些均對相關信息的分析有較大影響,因此,需進行EST序列的預處理。首先,利用est_trimmer.pl(http://pgrc.ipk-gatersleben.de/misa/download/est_trimmer.pl)軟件去除5′端或3′端50 bp的polyA或polyT,同時去除過短(<100 bp)的序列,過長(>700 bp)的EST序列則保留其5′端700 bp;然后,利用seq_trim軟件以通用載體序列為參考序列,去除載體系列[28];最后,利用Phrap軟件對EST序列進行聚類拼接,以去除冗余序列,拼接標準為:最小匹配堿基數(shù)(minmatch)為20,最小分值(minscore)為40[29~30]。
1.4 木麻黃EST-SSR位點的搜索
利用在線軟件SSRIT(Simple Sequence Repeat Identification Tool,SSRIT)(http://www.gramene.org/db/searches/ssrtool)對聚類后的非冗余EST序列進行SSR搜索。搜索條件為:二核苷酸的最少重復次數(shù)為9,三核苷酸的最少重復次數(shù)為6,四、五和六核苷酸的最少重復次數(shù)為5。
1.5 木麻黃EST序列比對和注釋
利用程序Blast2GO(https://www.blast2go.com/)對含有SSR位點的木麻黃EST序列與NCBI數(shù)據(jù)庫中的非冗余蛋白數(shù)據(jù)庫(non-redundant)進行同源性比對,參數(shù)設置為:e-value=10-3,hits=20,HSP length cutoff=33[31]。利用Blast2GO對比對結果進行mapping映射獲得GO terms,然后從細胞組分、分子功能、生物過程3個方面進行序列的功能注釋和分類。
1.6EST-SSR引物設計和有效EST-SSR標記的驗證
根據(jù)SSR位點兩側的序列,用Primer Premier5.0軟件來設計引物,引物長度一般為18~24個核苷酸,GC含量在40%~60%,退火溫度為50~65℃,正向引物和反向引物的退火溫度相差在2℃以內(nèi),預期擴增片段長度在100~500 bp。
試驗所有引物的合成由北京華大基因完成。引物篩選PCR反應體系為10 μL,即:1×buffer(100 mmol·L-1Tris-HCl pH9.0,80 mmol·L-1(NH4)2SO4,100 mmol·L-1KCl,0.5% NP-40),2.0 mmol·L-1MgCl2,200 μmol·L-1dNTP,0.5 μmol·L-1正向引物,0.5 μmol·L-1反向引物,1 U Taq DNA聚合酶,0.5 μmol·L-1模板DNA;擴增程序為:94℃預變性5 min,接以94℃ 30 s,退火溫度30 s,72℃ 1 min,循環(huán)數(shù)為35次,最后在72℃補平10 min,4℃保溫24 h;PCR擴增產(chǎn)物經(jīng)2%瓊脂糖凝膠于120 v,30 min電泳檢測片段是否存在單一明亮條帶,有單一明亮條帶的即為可有效擴增的ESR-SSR標記。
2.1 木麻黃EST序列的冗余性
從NCBI的dbEST數(shù)據(jù)庫獲得的木麻黃EST序列共有34 752條(截止2013年12月31日)。首先,用est_trimmer.pl軟件和進行seq_trim軟件進行序列預處理,去掉5′端或3′端50 bp的polyA或polyT;然后,運用Pharp軟件進行序列聚類拼接,去除冗余序列;最后,共獲得12 062條非冗余序列(即Unigenes),總長度為7 278.578 kb,序列冗余率達到65.29%。Unigene中,67.13%為單拷貝序列Singlets(8 098條),平均長度為533.4 bp,變化范圍為46~1 066 bp;Contigs為3 965條,平均長度達到746.5 bp,變化范圍為130~2 637 bp。Unigene長度分布如圖1所示。長度大于500 bp的Unigene占73.0%,長度為200~500 bp的Unigene占22.5%。
圖1 木麻黃Unigene長度分布Fig.1 Length distribution of casuarina Unigene
2.2 木麻黃EST-SSR的分布頻率和基序特征
利用SSRIT軟件對12,062個木麻黃Unigenes進行SSR位點搜索,共獲得367個SSR位點,這些SSR位點分布于353條Unigenes序列中。EST序列中含有SSR位點的頻率僅為2.93%,平均分布距離為19.83 kb。其中含有2個SSR位點的EST序列為12條,含有3個SSR位點的EST序列僅有1條,其余序列均為含有1個SSR位點的EST序列。
木麻黃EST-SSR類型豐富,包含二核苷酸、三核苷酸、四核苷酸、五核苷酸,以及六核苷酸5種類型(圖2)。其中,以二核苷酸和三核苷酸為主,所占比例分別為57.77%和34.60%,四核苷酸和六核苷酸所占比例相近,分別為3.27%和3.54%,五核苷酸所占比例極少,僅為0.82%。
圖2 木麻黃EST-SSR的分布頻率Fig.2 Distribution frequency of EST-SSR in Casuaria
共發(fā)現(xiàn)39種不同類型的重復基序,其中二核苷酸和五核苷酸重復基序的類型為3種,三核苷酸和四核苷酸重復基序的類型為10種,六核苷酸重復基序的類型最多,為13種;而二核苷酸重復基序數(shù)量最多,三核苷酸重復基序次之,其他重復基序的數(shù)量均較少。其中,在二核苷酸重復基序中,AG/CT數(shù)量最多,為199,占二核苷酸重復基元數(shù)的93.87%,AT/AT和AC/GT的數(shù)量相近,均較少,分別為7和6;在三核苷酸重復基序中AAG/CTT最多,為56,占三核苷酸重復基元數(shù)的44.09%,AGT/ATC和AGG/CCT的數(shù)量相近,分別為14和13,分別占三核苷酸重復基序數(shù)的11.02%和10.24%(表1)。
2.3 木麻黃EST-SSR的同源性比對分析
通過Blastx程序,對353條含有SSR的EST序列與NCBI非冗余蛋白序列數(shù)據(jù)庫(Nr)進行同源性比對分析。結果表明,共有273條EST序列具有同源序列,占序列總數(shù)的77.3%,其中有3條EST序列與未知功能蛋白同源,其余80條EST序列無同源序列(圖3:A)。在270條已知功能的EST序列中,主要比對到巨桉(14條)、麻瘋樹(18條)、葡萄(28條)、可可(17條)、毛果楊(11條)、烏梅(15條)、川桑(11條)、蓖麻(13條)、胡楊(7條)、金錢橘(12條)、梨(12條)、蘋果(9條)、桃(12條),其他植物91條,其中,所占比例最大的是葡萄、其次是麻瘋樹和可可,巨桉、毛果楊、烏梅的比例相近(圖3:B)。
表1 SSR中重復基序的比例
圖3 木麻黃EST-SSR序列同源性比對分析Fig.3 Blast analysis of EST-SSR in Casuaria
2.4 木麻黃EST-SSR的功能注釋及分類
圖4 木麻黃EST-SSR序列GO功能注釋Fig.4 GO functional ontology of EST-SSR in Casuaria
為了對含有SSR位點的EST序列進行功能分類,對這些序列進行GO注釋。在353條含有SSR的EST序列中共有167條(47.3%)序列至少具有1個GO功能注釋,并且包含在60個功能項。其中,生物過程(Biological processes,BP)159條,細胞組分(Cellular components,CC)160條,分子功能(Molecular function,MF)148條(圖4)。在生物過程中,歸入DNA轉錄調節(jié)(regulation of transcription DNA-templated)和DNA轉錄(transcription DNA-templated)的序列最多;在細胞組分中,歸入細胞核(nucleus)和細胞質(cytoplasm)的序列最多,細胞溶質(cytosol)和細胞質膜(plasma membrane)次之;在分子功能中,歸入ATP結合(ATP binding)的最多,DNA結合(DNA binding)和金屬離子結合(metal ion binding)次之;其他功能類別包括脫落酸響應、鹽脅迫響應、防御響應、蛋白激酶活性、液泡膜和細胞壁等。
表2 EST-SSR引物信息
2.5 EST-SSR的有效篩選
對所獲得的367個SSR位點設計引物,其中由于存在退火溫度過高或過低、包含引物二聚體等情況,有256個位點在所設定的引物設計條件中無法獲得適合的引物,獲得97對待篩選SSR引物。利用12個木麻黃個體對這97個待篩選引物進行PCR驗證,有32個引物可獲得單一明亮條帶(圖5),其引物序列和退火溫度信息見表2。
圖5 引物篩選PCR檢測Fig.5 PCR detection of primer selection
隨著植物功能基因組研究的迅速發(fā)展,公共數(shù)據(jù)庫中的表達序列標簽(ESTs)呈指數(shù)趨勢增長,通過搜索EST序列中的SSR位點開發(fā)新的EST-SSR標記成為新標記開發(fā)的焦點。本研究中通過搜索公共數(shù)據(jù)庫中34 752條EST序列中的SSR位點,得到位點總數(shù)367個,檢出率僅為2.93%。Areshchenkova等在27 000條番茄EST序列中搜索SSR位點時,發(fā)現(xiàn)SSR位點數(shù)250個,檢出率僅為1.2%[32];吳春太等在39 227條油棕EST序列中檢索得到699個SSR位點,檢出率4.45%[33];而韓明利等利用NCBI數(shù)據(jù)庫中與番茄果實性狀相關的83 613條EST序列檢索得到2 382個SSR位點,檢出率高達10.8%[34];另外,本文中木麻黃EST序列中SSR的平均分布距離為19.83 kb,遠低于大豆(7.40 kb)、玉米(8.10 kb)等作物,但與棉花(20.00 kb)中SSR的平均分布距離相近[35]。這可能是由于兩個方面的原因造成的:一,由于公共數(shù)據(jù)庫中的EST序列存在冗余性,這將會影響精確估計EST序列中SSR的發(fā)生頻率;二,所用處理軟件以及設置參數(shù)的不同,也將影響EST序列中SSR位點的檢出率。
EST-SSR標記廣泛應用于遺傳圖譜構建、基因定位及比較基因組學研究中。安澤偉等利用10 778條橡膠樹EST序列,搜索得到430個SSR位點,針對這些EST-SSR位點,在所設計的148對引物中,篩選得到15對可有效擴增且在橡膠樹無性系中表現(xiàn)出較高多態(tài)性的標記[36];本文中,對367個木麻黃EST-SSR位點設計了97對引物,其中有32對為有效擴增引物,說明利用公共數(shù)據(jù)庫中的EST序列開發(fā)SSR標記,進行木麻黃遺傳學研究是可行的,當然這些EST-SSR標記的多態(tài)性有待于進一步分析。因設置的引物設計參數(shù)較為嚴苛,本文中設計得到的引物偏少,而通過設置適當?shù)能浖?shù),以適中的搜索條件和設計要求進行SSR位點搜索和引物設計,可獲得更多的SSR位點,并以此得到更多的可篩選引物。木麻黃EST-SSR標記的開發(fā),將有利于木麻黃遺傳多樣性研究,對于拓寬木麻黃種質資源遺傳基礎也具有積極意義。
EST-SSR的多態(tài)性主要源于重復次數(shù)和重復長度[34]。一般認為DNA復制或修復過程中DNA鏈的滑動和錯配,或者有絲分裂或減數(shù)分裂過程中姐妹染色單體的不均等交換,是造成SSR長度變異的主要原因。木麻黃EST序列中SSR重復基序的重復次數(shù)在5~52變化,最大的重復次數(shù)存在于二核苷酸中。詹少華等研究認為大豆中SSR基序重復次數(shù)變異范圍越大,SSR標記的多態(tài)性就越高[37]。而李淑嫻等在研究桉樹屬(Eucalyptus)SSR長度變化時獲得桉樹屬SSR位點1 775個,SSR序列長度變化范圍為12~64 bp,平均長度18.5 bp,其發(fā)現(xiàn)桉樹EST-SSR的長度變異速率、SSR位點的豐度均與重復基元的長度呈負相關關系,且二核苷酸重復SSR的理論多態(tài)性最高[38],與本研究結果一致。
EST是cDNA克隆測序產(chǎn)生的部分序列,通過與公共數(shù)據(jù)庫中非冗余蛋白質或核酸序列進行相似性比對,可進行EST-SSR的功能分析。吳春太等對公共數(shù)據(jù)庫中油棕(ElaeisguineensisJacg.)的EST序列進行聚類拼接處理后,搜索油棕非冗余序列中的SSR位點,通過對含有SSR位點的EST序列進行BLASTx比對,發(fā)現(xiàn)與細胞相關的SSR-EST序列占有較大比例(76.47%)[33];本文中,353條含有SSR位點的EST序列經(jīng)過同源性比對發(fā)現(xiàn),270條與已知功能序列同源,3條與未知功能序列具有同源性,另外80條無同源序列,而在已知功能的EST序列中,主要比對到葡萄、麻瘋樹、可可以及巨桉等樹種(圖3:B),且同源性較高,與葡萄、可可及巨桉序列的相似性均為84%,與麻瘋樹序列的相似性為83%。分析發(fā)現(xiàn),許多序列涉及多重功能,如轉錄調節(jié)、代謝過程、細胞生理過程等。
植物中有關EST序列的功能研究進展緩慢,但大量動物和人類基因研究認為,SSR可能參與基因表達調控以及基因重排和變異等重要的生命活動,SSR長度的變化對生命活動有顯著影響[14,39~40]。當關聯(lián)比較基因組遺傳信息和質量性狀信息時,運用EST-SSR標記可有效的進行功能基因的定位和鑒別,以及遺傳圖譜和物理圖譜等的構建[41~42]。本研究通過搜索木麻黃總EST序列中的SSR,分析了木麻黃EST-SSR的分布頻率和特點,以期為木麻黃重要生態(tài)性狀相關標記的開發(fā),木麻黃重要生態(tài)及經(jīng)濟性狀的遺傳連鎖圖譜的構建,以及木麻黃種質資源分析和分子輔助育種提供參考資料。
1.Chen X,Cho Y G,McCouch S R.Sequence divergence of rice microsatellites inOryzaand other plant species[J].Mol Gen Genomics,2002,268:331-343.
2.Fahima T,R?der M S,Grama A,et al.Microsatellite DNA polymorphism divergence inTriticumdicoccoidesaccessions highly resistant to yellow rust[J].Theor Appl Genet,1998,96:187-195.
3.Huang X,B?rner A,R?der M,et al.Assessing genetic diversity of wheat(TriticumaestivumL.)germplasm using microsatellite markers[J].Theoretical and Applied Genetics,2002,105(5):699-707.
4.Loudet O,Chaillou S,Camilleri C,et al.Bay-0×Shahdara recombinant inbred line population:a powerful tool for the genetic dissection of complex traits inArabidopsis[J].Theoretical and Applied Genetics,2002,104(6-7):1173-1184.
5.R?der M S,Korzun V,Wendehake K,et al.A microsatellite map of wheat[J].Genetics,1998,149(4):2007-2023.
6.Ma X F,Wanous M K,Houchins K,et al.Molecular linkage mapping in rye(SecalecerealeL.)[J].Theoretical and applied genetics,2001,102(4):517-523.
7.Gupta P K,Varshney R K.The development and use of microsatellite markers for genetic analysis and plant breeding with emphasis on bread wheat[J].Euphytica,2000,113(3):163-185.
8.Korzun V,R?der M,Worland A J,et al.Intra-chromosomal mapping of genes for dwarfing(Rht12) and verbalization response(Vrn1) in wheat by using RFLP and microsatellite markers[J].Plant Breeding,1997,116(3):227-232.
9.Liu X,Smith C,Gill B.Identification of microsatellite markers linked to Russian wheat aphid resistance genes Dn4 and Dn6[J].Theoretical and Applied Genetics,2002,104(6-7):1042-1048.
10.Buchanan F C,Adams L J,Littlejohn R P,et al.Determination of evolutionary relationships among sheep breeds using microsatellites[J].Genomics,1994,22(2):397-403.
11.Li C D,Rossnagel B G,Scoles G J.The development of oat microsatellite markers and their use in identifying relationships among Avena species and oat cultivars[J].Theoretical and Applied Genetics,2000,101(8):1259-1268.
12.Matsuoka Y,Mitchell S E,Kresovich S,et al.Microsatellites in Zea-variability,patterns of mutations,and use for evolutionary studies[J].Theoretical and Applied Genetics,2002,104(2-3):436-450.
13.Cardle L,Ramsay L,Milbourne D,et al.Computational and experimental characterization of physically clustered simple sequence repeats in plants[J].Genetics,2000,156(2):847-854.
14.Tóth G,Gáspári Z,Jurka J.Microsatellites in different eukaryotic genomes:survey and analysis[J].Genome research,2000,10(7):967-981.
15.Morgante M,Hanafey M,Powell W.Microsatellites are preferentially associated with non-repetitive DNA in plant genomes[J].Nature genetics,2002,30(2):194-200.
16.Bundock P C,Potts B M,Vaillancourt R E.Detection and stability of quantitative trait loci(QTL) inEucalyptusglobulus[J].Tree Genetics & Genomes,2008,4(1):85-95.
17.Freeman J S,Whittock S P,Potts B M,et al.QTL influencing growth and wood properties inEucalyptusglobulus[J].Tree Genetics & Genomes,2009,5(4):713-722.
18.Byrne M,Murrell J C,Owen J V,et al.Mapping of quantitative trait loci influencing frost tolerance inEucalyptusnitens[J].Theoretical and Applied Genetics,1997,95(5-6):975-979.
19.Wilson K L,Johnson L A S.Casuarinaceae.Flora of Australia:Volume 3 Hamamelidales to Casuarinales[M].Canberra:Australian Government Publishing Service,1989.
20.仲崇祿.木麻黃遺傳變異規(guī)律的研究[D].北京:中國林業(yè)科學研究院,2000.
21.葛菁萍,林鵬.廈門三種木麻黃屬(Casuarina)植物的種內(nèi)遺傳變異和種間親緣關系分析[J].黑龍江大學自然科學學報,2002,19(4):110-114.
22.郭啟榮,林益明,周涵滔.4種木麻黃親緣關系的RAPD分析[J].廈門大學學報:自然科學版,2003,42(3):378-383.
23.何坤益,蕭如英,鄧書麟.應用RAPD分子指紋研究木賊葉木麻黃國際種源之遺傳變異[J].臺灣林業(yè)科學,2001,16(4):285-293.
24.黃桂華.短枝木麻黃種質資源遺傳多樣性的AFLP分析[D].北京:中國林業(yè)科學研究院,2006.
25.Huang G H,Zhong C L,Su X H,et al.Genetic variation and structure of native and introducedCasuarinaequisetifolia(L.Johnson) provenances[J].Silvae Genetica,2009,58(1-2).
26.Ho Kuen-yih,Lee Shih-chieh.ISSR-based genetic diversity ofCasuarinaspp.in coastal windbreaks of Taiwan[J].African Journal of Agriculture Research,2011,6(25):5664-5671.
27.Doyle J J.Trees within trees:genes and species,molecules and morphology[J].Systems Biology,1997,46:537-553.
28.Falgueras J,Lara A J,Fernández-Pozo N,et al.SeqTrim:a high-throughput pipeline for pre-processing any type of sequence read[J].BMC bioinformatics,2010,11(1):38.
29.Gordon D,Abajian C,Green P.Consed:a graphical toolfor sequence finishing[J].Genome Res,1998,8:195-202.
30.Gordon D,Desmarais C,Green P.Automated finishingwith auto-finish[J].Genome Res,2001,11:614-625.
31.Conesa A,G?tz S,Carcía-Gómes JM,et al.Blast2go:a universal tool for annotation,visualization and analysis in functional genomics research[J].Bioinformatics,2005,21(18):3674-3676.
32.Areshchenkova T,Ganal M W.Comparative analysis of polymorphism and chromosomal location of tomato microsatellite markers isolated from different sources[J].Theoretical and Applied Genetics,2002,104(2-3):229-235.
33.吳春太,陳青,劉銳,等.油棕EST序列中SSR的分布特征分析[J].中國油料作物學報,2012,34(1):101-105.
34.韓明利,崔娜,于志海,等.番茄果實EST資源SSR信息分析[J].華北農(nóng)學報,2011,26(4):213-217.
35.李永強,李宏偉,高麗鋒,等.基于表達序列標簽的微衛(wèi)星標記(EST-SSRs)研究進展[J].植物遺傳資源學報,2004(5):91-95.
36.安澤偉,趙彥宏,程漢,等.橡膠樹EST-SSR標記的開發(fā)與應用[J].遺傳,2009,31(3):311-319.
37.詹少華,盛新穎,樊洪泓,等.大豆EST序列長度與SSR特性的關系[J].大豆科學,2009,28(2):204-209.
38.李淑嫻,張新葉,王英亞,等.桉樹EST序列中微衛(wèi)星含量及相關特征[J].植物學報,2010,45(3):363-371.
39.Thibodeau S N,Bren G,Schaid D.Microsatellite instability in cancer of the proximal colon[J].Science,1993,260(5109):816-819.
40.Aaltonen L A,Lauri A,Leach F S,et al.Clues to the pathogenesis of familial colorectal cancer[J].Science,1993,260(5109):812-816.
41.張新葉,宋叢文,張亞東,等.楊樹EST-SSR 標記的開發(fā)[J].林業(yè)科學,2009,45(9):53-59.
42.Ellis J R,Burke J M.EST-SSRs as a resource for population genetic analyses[J].Heredity,2007,99:125-132.
DistributionandMolecularMarkerofSSRinESTResourceofCasuarinaceae
HU Pan1ZHONG Chong-Lu1ZHANG Yong1JIANG Qing-Bin1CHEN Yu1CHEN Zhen1HAN Qiang1Khongsak Pinyopusarerk2Didier Bogusz3
(1.Research Institute of Tropical Forestry,Chinese Academy of Forestry,Guangzhou 510520;2.CSIRO National Research Collections Australia,Acton,ACT 2600,Australia;3.Institut de Recherche pour le Développement(IRD),BP 64501,Montpellier,France)
There are 34 752 ESTs of Casuarinaceae in the database of NCBI, resulting in 12 062 non-redundant sequences(Unigene) with total length of 7 278.578 kb. 367 SSR were discovered to distribution on 353 Unigenes, the frequency and repeat motif types number of these EST-SSRs was 2.93% and 39, and the mean distance was 19.83 kb. Dinucleotide and trinucleotide repeats were the dominant types among the EST-SSRs, accounting for 57.77% and 34.06%, respectively. AG/CT(93.87%) and AAG/CTT(44.09%) were the most abundant motifs for dinucleotide and trinucleotide. There were 97 pairs of primers designed for the obtained EST-SSR, and 32 of all could be effectively amplified. By Blast analysis, 77.3% ESTs sequences containing SSR locus were homologous with functional sequences in non-redundant protein sequences databases. The homology with functions from Vitis vinifera had the greatest proportion(10.4%). By GO functional classification, 47.3% EST sequences containing SSR locus had at least one GO ontology, the sequences relevant to cellular components were most, and the functional items relevant to cytoplasm and nucleus were highest.
Casuarinaceae;EST;SSR
十二五林業(yè)科技支撐計劃任務(2012BAD01B0603);廣東省林業(yè)科技創(chuàng)新專項資金項目(2014KJCX017);國家自然科學基金項目(31470634)和福建省林木種苗科技攻關四期項目的子課題4:木麻黃改良代種子園營建技術研究
胡盼(1987—),女,博士研究生,主要從事木麻黃遺傳改良研究。
* 通信作者:E-mail:zcl@ritf.ac.cn
2015-06-08
S792.93
A
10.7525/j.issn.1673-5102.2016.01.016