涂飛云,劉曉華,杜聯(lián)明,嚴超超,黃曉鳳*
(1.江西省林業(yè)科學院,江西 南昌 330013;2.四川大學 生命科學學院/四川省瀕危野生動物保護生物學重點實驗室,四川 成都 610064)
微衛(wèi)星又稱簡單序列重復(simple sequence repeats,SSRs),是指1~6 bp的核苷酸為基本重復單位的串聯(lián)重復序列,其長度大多在100 bp以內[1],廣泛存在于真核生物和一些原核生物的基因組中[2]。微衛(wèi)星因突變速率快、多態(tài)性高等特性,廣泛應用于動物個體識別[3-5]、群體遺傳研究[6-7]、基因定位[8]、系統(tǒng)發(fā)育[9]及遺傳疾病研究[10]。
隨著基因測序技術發(fā)展,更多物種的全基因組被測定和公布,有關動物基因組微衛(wèi)星報道也越來越多。到目前為止,有關哺乳動物全基因的序列公布有43種(http://asia.ensembl.org/info/data/ftp/index.html),但哺乳動物全基因微衛(wèi)星分布規(guī)律研究報道文獻僅見4篇[11-14]。大鼠是繼人類、小鼠之后第三個被測定全基因組的哺乳動物,是極好的模式生物,作為實驗材料廣泛地應用于醫(yī)學、藥學研究中。Tóth等[15]利用嚙齒類81個物種的基因序列(其中大鼠基因序列貢獻率是18.25%)進行微衛(wèi)星序列分析。迄今為止,大鼠全基因組微衛(wèi)星分布狀況未見報道。本研究通過生物信息學方法搜索大鼠全基因組微衛(wèi)星,并對微衛(wèi)星數(shù)量、分布、頻率進行分析,為進一步開發(fā)大鼠微衛(wèi)星的標記提供數(shù)據(jù)支持。
大鼠全基因組序列是從NCBI數(shù)據(jù)庫下載的版本名為Rnor_6.0(2014年8月發(fā)布)的基因組序列(ftp://ftp.ncbi.nlm.nih.gov/genomes/Rattus_norvegicus)。該基因組包括 20 個常染色體、2 個性染色體(X,Y)和未定位到染色體上的序列(其中已經定位到染色體上的序列占全基因組的99%),基因組總長度約2.8 Gb,所有序列都以FASTA格式保存。
1.2.1 微衛(wèi)星序列統(tǒng)計術語的定義 微衛(wèi)星序列統(tǒng)計術語的定義參照戚文華等[12-13]的研究。
1.2.2 微衛(wèi)星搜索及統(tǒng)計分析 MSDB是用Perl語言編開發(fā)的界面友好的分析軟件,能快速識別和搜索全基因組微衛(wèi)星。與其他微衛(wèi)星搜索軟件如TRF、SSRTT、MSATCOMMANDER等軟件相比,MSDB具有運算速度快,操作簡便,易于分析等特點[16]。本研究利用微衛(wèi)星搜索軟件MSDBv2.4.3[16]對不同染色體基因序列進行微衛(wèi)星搜索及統(tǒng)計。本研究的搜索標準采用軟件默認設置,模式設置為Perfect Search,最小重復(Minimum repeats)設置為單堿基12次重復以上、二堿基7次重復以上、三堿基5次以上、四堿基、五堿基和六堿基4次以上[16]。利用SPSS軟件對大鼠染色體序列長度與微衛(wèi)星數(shù)量分析。參照堿基互補配對原則和統(tǒng)計拷貝數(shù)起始堿基順序的排列差異,利用Perl語言腳本將同類重復兼并為一種重復拷貝類型代表,如三堿基AAC,可以與之兼并的有ACA、CAA、TTG、TGT和GTT。
大鼠基因組全長2 860 318 831 bp,微衛(wèi)星總數(shù)1 483 525個,其總長度是40 198 048 bp,占全基因組的1.41%(表1)。大鼠各染色體中,1號染色體的微衛(wèi)星數(shù)量最多,有144 384個,占微衛(wèi)星總數(shù)的9.7%,出現(xiàn)的頻率是511個/Mb,其長度合計3 941 664 bp,其次是2號、4號、3號染色體,分別占微衛(wèi)星總數(shù)的8.5%、6.3%、6.2%(表1),20號染色體分布的微衛(wèi)星數(shù)量最低,僅占總數(shù)的2.3%。從各染色體微衛(wèi)星分布頻率看,12號染色體最高,其次是10號,最低X性染色體。通過線性回歸分析表明,大鼠染色體DNA序列越長,所含微衛(wèi)星數(shù)量越多(r=0.978,P<0.000 1)。大鼠性染色體微衛(wèi)星數(shù)量存在顯著差異,X染色體微衛(wèi)星數(shù)量有62 578,占總數(shù)的4.2%,而Y染色體微衛(wèi)星數(shù)量僅有35 067,僅占2.4%(表1)。
從表1看,整個大鼠全基因組中不同重復類型微衛(wèi)星占全基因組微衛(wèi)星比例表現(xiàn)為二堿基(46.9%)>單堿基(22.6%)>四堿基(17.4%)>三堿基(8.4%)>五堿基(2.4%)>六堿基(2.0%)。
不同重復類型微衛(wèi)星在染色體分布數(shù)量上,6種重復類型(單堿基、二堿基、三堿基、四堿基、五堿基、六堿基)微衛(wèi)星總數(shù)在1號染色體分布最多,其次是2號染色體。不同重復類型微衛(wèi)星分布數(shù)量最少的染色體并不一致(表1)。
從不同重復類型微衛(wèi)星重復拷貝類別數(shù)量比例看,單堿基以A微衛(wèi)星數(shù)量占優(yōu)勢,分別占單堿基微衛(wèi)星總數(shù)的46.6%。二堿基微衛(wèi)星類型搜索到4種,有AC、AG、AT、CG,整個大鼠全基因組序列以AC類型最多,占二堿基微衛(wèi)星總數(shù)的64.6%,其次是AG,占24.9%,CG最少,僅占0.6%。共兼并及統(tǒng)計三堿基微衛(wèi)星重復類型 10 種,包括 AAC、AAG、AAT、ACC、ACG、ACT、AGC、AGG、AGT、CCG,其中AGG類型數(shù)量最多,占三堿基微衛(wèi)星總數(shù)的 21.2%,依次是 AAC、AAT,占20.8%、13.5%;CCG 類型最少,其次是AGC,分別占0.9%和3.4%。四堿基微衛(wèi)星類型以AAAC類型最多,占四堿基微衛(wèi)星總數(shù)的14.9%,其次是AGAT和AAAG,占11.9%和11.1%。五堿基微衛(wèi)星以AAACA占優(yōu)勢,占39.8%。六堿基以ACAGAG占優(yōu)勢,占18.9%。
表1 大鼠不同染色體上不同類型微衛(wèi)星數(shù)量的分布情況Tab.1 Distribution of SSRs in each chromosome of rat
本研究首次利用生物信息學方法搜索、統(tǒng)計、分析大鼠全基因組微衛(wèi)星數(shù)量、分布及頻率。大鼠全基因組共搜索到微衛(wèi)星總數(shù)1 483 525,其序列長度占全基因組的1.41%。本研究表明微衛(wèi)星數(shù)量與其所在染色體DNA序列長度具有相關性(r=0.978,P<0.000 1),反映了SSRs在染色體上的分布具有隨機性,與先前其他研究結果一致[13、17],進一步支持Hancock[18]提出的微衛(wèi)星數(shù)量與染色體大小相關的假說。
不同物種基因組優(yōu)勢類型微衛(wèi)星有所不同。秀麗隱桿線蟲Caenorhabditis elegans[18]、肩突硬蜱Ixodes scapularis[19]、紅原雞 Gallus gallus[17]、四川山鷓鴣 Arborophila rufipectus[20]、牛 Bos taurus[12]、綿羊Ovis aries[12]、豬 Sus scrofa[13]等全基因組均以單堿基占優(yōu)勢;二斑葉螨 Tetranychus urticae[19]全基因組以三堿基占優(yōu)勢;蚊子Anopheles gambiae[21]以六堿基占優(yōu)勢。本研究大鼠基因組微衛(wèi)星以二堿基微衛(wèi)星占絕對優(yōu)勢,與果蠅 Drosophila melanogaster[22]、家蠶 Bombyx mori[23]、蜜蜂 Apis mellifera[24]、河豚 Fugu rubripes[25]、全基因組及中國對蝦 Fenneropenaeus chinensis[26]、嚙齒類[19]部分基因組中二堿基微衛(wèi)星占主導結果一致。
本研究中大鼠全基因組單堿基微衛(wèi)星以A占優(yōu)勢,與人類、紅原雞、豬等物種研究結果一致[15],其余不同重復類型微衛(wèi)星在不同類群中具有差異。大鼠二堿基微衛(wèi)星以AC最為豐富,與人類、果蠅、蚊子、豬、牛和綿羊的結果一致,不同于中國對蝦、蜜蜂、紅原雞二堿基以AT最豐富。三堿基、四堿基、五堿基、六堿基分別以 AGG、AAAC、AAACA、ACAGAG占優(yōu)勢,而其他物種如豬、牛、羊并非以此四種(AGG、AAAC、AAACA、ACAGAG)類型微衛(wèi)星占優(yōu)勢,可能是不同物種優(yōu)勢類型微衛(wèi)星有所不同。
致謝:特別感謝四川大學生命科學學院李午佼博士對研究的幫助。
[1]Li Y C,Korol A B,F(xiàn)ahima T,et al.Microsatellites:genomic distribution,putative functions and mutational mechanisms:a review[J].Molecular Ecology,2002,11(12):2453-2465.
[2]Tautz D.Hypervariability of simple sequences as a general source for polymorphic DNA markers[J].Nucleic Acids Research,1989,17(16):6463-6471.
[3]Amavet P,Rosso E,Markarian R,et al.Microsatellite DNA markers applied to detection of multiple paternity in Caiman latirostris in Santa Fe,Argentina[J].Journal of Experimental Zoology,2008,309A:637-642.
[4]王靜,劉丑生,張利平,等.微衛(wèi)星在種公牛個體識別與親緣鑒定方面的應用[J].遺傳,2009,31(3):285-289.
[5]管昊,林清賢,周曉平,等.白鷺脫落羽毛的微衛(wèi)星個體識別研究[J].廈門大學學報:自然科學版,2013,52(5):710-717.
[6]Hu Y B,Guo Y,Qi D W,et al.Genetic structuring and recent demographic history of red pandas(Ailurus fulgens)inferred from microsatellite and mitochondrial DNA[J].Molecular Ecology,2011,20:2662-2675.
[7]Wu S J,Luo J,Li Q Q,et al.Ecological genetics of Chinese rhesus macaque in response to mountain building:all things are not equal[J].Plos One,2013,8(2):55315.
[8]徐寧迎,Thomsen H,Reinsch N,等.利用微衛(wèi)星進行奶牛數(shù)量形狀基因定位的研究[J].遺傳學報,2000,27(9):772-776.
[9]Estoup A,Lionel G.Microsatellite variation in honey bee(Apis mellifera L.)populations:hierarchical genetic structure and test of the infinite allege and stepwise mutation models[J].Genetics,1995,140(2):679-695.
[10]陳翠敏,府偉靈,張曉莉.應用微衛(wèi)星多態(tài)位點對X連鎖型視網(wǎng)膜色素變性疾病進行遺傳連鎖分析的研究[J].重慶醫(yī)學,2006,35(6):501-502.
[11]童曉玲,代方銀,李斌,等.小鼠基因組中的微衛(wèi)星重復序列的數(shù)量、分布和密度[J].動物學報,2006,52(1):138-152.
[12]戚文華,蔣雪梅,肖國生,等.牛和綿羊全基因組微衛(wèi)星序列的搜索及其生物信息學分析[J].畜牧獸醫(yī)學報,2013,44(11):1724-1733.
[13]戚文華,蔣雪梅,肖國生,等.豬全基因組中微衛(wèi)星分布規(guī)律[J].畜牧與獸醫(yī),2014,46(8):9-12.
[14]李午佼,李玉芝,杜聯(lián)明,等.大熊貓和北極熊基因組微衛(wèi)星分布特征比較分析[J].四川動物,2014,33(6):874-878.
[15]Tóth G,Gáspári Z,Jurka J.Microsatellites in different eukaryotic genomes:survey and analysis[J].Genome Research,2000,10:967-981.
[16]Du L M,Li Y Z,Zhang X Y,et al.MSDB:a user-friendly program for reporting distribution and building databases of microsatellites from genome sequences[J].Journal of Heredity,2013,104(1):154-157.
[17]黃杰,杜聯(lián)明,李玉芝,等.紅原雞全基因組中微衛(wèi)星分布規(guī)律研究[J].四川動物,2012,31(3):358-363.
[18]Hancock J M.Simple sequences and the expanding genome[J].Bioessays,1996,18(5):421-425.
[19]汪自立,黃杰,杜聯(lián)明,等.二斑葉螨和肩突硬蜱基因組微衛(wèi)星分布規(guī)律研究[J].四川動物,2013,32(4):481-486.
[20]黃杰,周瑜,劉與之,等.基于454 GS FLX高通量測序的四川山鷓鴣基因組微衛(wèi)星特征分析[J].四川動物,2015,34(1):8-14.
[21]余泉友,李斌,李關榮,等.蚊子全基因組中微衛(wèi)星的豐度及其分布[J].生物化學與生物物理進展,2005,32(5):435-441.
[22]Schug M D,Wetterstrand K A,Gaudette M S,et al.The distribution and frequency of microsatellite loci in Drosophila melanogaster[J].Molecular Ecology,1998,7(1):57-70.
[23]Li B,Xia Q Y,Lu C,et al.Analysis on frequency and density of microsatellites in coding sequences of several eukaryotic genomes[J].Genomics,Proteomics and Bioinformatics,2004,2(1):24-31.
[24]魏朝明,孔光耀,廉振民,等.蜜蜂全基因組中微衛(wèi)星的豐度及其分布[J].昆蟲知識,2007,44(4):501-504.
[25]崔建洲,申雪艷,楊官品,等.紅鰭東方鲀基因組微衛(wèi)星特征分析[J].中國海洋大學學報,2006,36(2):249-254.
[26]高煥,劉萍,孟憲紅,等.中國對蝦(Fenneropenaeus chinensis)基因組微衛(wèi)星特征分析[J].海洋與湖沼,2004,35(5):424-431.