申 欣, 田 美 孟學平 程漢良
(1. 淮海工學院 海洋學院, 江蘇 連云港 222005; 2. 中國科學院 海洋研究所, 山東 青島 266071)
文昌魚線粒體基因組特征分析及分子標記探討
申 欣1,2, 田 美1, 孟學平1, 程漢良1
(1. 淮海工學院 海洋學院, 江蘇 連云港 222005; 2. 中國科學院 海洋研究所, 山東 青島 266071)
線粒體基因組已被廣泛應用于后生動物分子系統(tǒng)發(fā)育和群體遺傳的研究。文昌魚(Amphioxus)作為研究脊椎動物起源和進化的模式動物, 在脊椎動物起源和進化研究中占據(jù)極為重要的位置。作者綜合分析文昌魚2科7個種的51條線粒體基因組全序列, 全面揭示了文昌魚線粒體基因組的基本特征。文昌魚線粒體基因組均編碼后生動物標準的 37個基因, 文昌魚線粒體基因組共有 3種基因排列方式,其中文昌魚屬和側(cè)殖文昌魚屬共有的基因排列與脊椎動物線粒體基因組的典型排列相比最為接近。因此, 文昌魚屬和側(cè)殖文昌魚屬線粒體基因組的基因排列方式代表了文昌魚原始的基因排列方式。與此相比, 偏文昌魚屬的3個物種發(fā)生了基因重排。文昌魚線粒體基因組13個蛋白編碼基因的Ka/Ks值均遠遠低于 1(0~0.3363), 顯示出較強的純化(負)選擇。文昌魚線粒體基因組種間和種內(nèi)基因變異分析表明, 在文昌魚群體遺傳的研究中,nad5、nad4和nad2基因是理想的分子標記, 可以作為cox1基因輔助的分子標記, 用于分析文昌魚不同群體之間的遺傳多樣性, 為其生物多樣性的保護及合理利用其生物資源提供更多基礎資料。
文昌魚(amphioxus); 線粒體基因組; 差異位點; 分子標記
線粒體基因組作為核外遺傳物質(zhì)具有結(jié)構(gòu)簡單、基因排列緊湊和嚴格的母系遺傳等特點, 在過去的十幾年中已經(jīng)被廣泛應用于后生動物分子系統(tǒng)發(fā)育和群體遺傳的研究[1-4]。文昌魚(Amphioxus或者Lancelet)隸屬于脊索動物門(Chordata)頭索動物亞門(Cephalochordata), 一直是研究脊椎動物起源和進化的模式動物, 在脊椎動物起源和進化研究中占據(jù)極為重要的位置, 有重要的科研價值和一定的經(jīng)濟價值[5-7]。在GenBank線粒體基因組的數(shù)據(jù)庫中, 目前有54條文昌魚的線粒體基因組序列。經(jīng)相似性比較后, 剔除了在物種鑒定上可能存在爭議的 3條線粒體基因組序列。作者在 51條文昌魚線粒體基因組序列(分別代表了文昌魚2科3屬7種, 圖1)研究的基礎上, 全面分析了文昌魚線粒體基因組的基本特征、基因排列、蛋白質(zhì)編碼基因和差異位點等, 對于文昌魚的生物多樣性的保護及其生物資源合理利用等諸多方面提供遺傳信息,為尋找合適的分子標記提供參考。
從GenBank線粒體基因組數(shù)據(jù)庫中檢索、下載得到 54條文昌魚線粒體基因組全序列。經(jīng) BLAST和 Clustal[8]相似性比較后, 3條線粒體基因組(NC_001912矛形文昌魚(Branchiostoma lanceolatum)、NC_008069日本文昌魚(B. japonicum)和AY932825白氏文昌魚(B. belcheri))在物種鑒定上可能會存在爭議(文昌魚物種鑒定上可能會出現(xiàn)錯誤,在以前的文獻中也有報道[9]),剔除后剩余的51條線粒體基因組序列, 分別是隸屬于文昌魚科(Branchiostomidae)的白氏文昌魚、佛羅里達文昌魚(B. floridae)和矛形文昌魚; 以及隸屬于側(cè)殖文昌魚科(Epigonichthyidae)的馬爾代夫側(cè)殖文昌魚(Epigonichthys maldivensis)、尖刀偏文昌魚(Asymmetron lucayanum)、偏文昌魚(A. inferum)和偏文昌魚A.sp.A TK-2007[9-13](圖1)。其中白氏文昌魚、佛羅里達文昌魚、矛形文昌魚和尖刀偏文昌魚分別有14條、21條、11條和2條線粒體基因組全序列(表1)。
圖1 目前已測定線粒體基因組全序列的文昌魚物種Fig. 1 Amphioxus species with complete determination of mitochondrial genome
表1 文昌魚線粒體基因組的基本特征Tab. 1 Basic features of amphioxus mitochondrial genomes
進化速率是受穩(wěn)定性(負)選擇、突變和定向(正)選擇控制的, 為了檢驗選擇壓力對于文昌魚(以白氏文昌魚、佛羅里達文昌魚、矛形文昌魚和尖刀偏文昌魚為代表)線粒體基因組的影響, 線粒體基因組中13個蛋白質(zhì)編碼基因的核酸序列通過Clustal X[8]進行多重序列比對。同義替換率(Ks)和非同義替換率(Ka)通過PAML[14]和DnaSP 4.10.7[15]進行了估算。
以7種文昌魚線粒體基因組數(shù)據(jù)作為數(shù)據(jù)群進行了種間基因差異位點和基因變異分析, 同時以14條白氏文昌魚、21條佛羅里達文昌魚、11條矛形文昌魚和2條尖刀偏文昌魚作為數(shù)據(jù)群進行了種內(nèi)基因差異位點和基因變異分析。13個蛋白質(zhì)編碼基因和2個核糖體RNA基因的核酸序列通過Clustal X[8]進行多重序列比對, 然后通過 DnaSP 4.10.7[15]分析了線粒體基因組主編碼基因的差異位點和基因變異特征。
文昌魚7個物種線粒體基因組長度介于14 975 bp(馬爾代夫側(cè)殖文昌魚)和 15 146 bp(矛形文昌魚)之間。7個物種的線粒體基因組均編碼后生動物標準的37個基因(13個蛋白質(zhì)編碼基因、22個轉(zhuǎn)運RNA基因和2個核糖體RNA基因)(表1, 圖2)。線粒體基因組主編碼鏈的 A+T含量最高的為 64.8%(白氏文昌魚), 最低的為59.1%(偏文昌魚A.sp. A TK-2007)。文昌魚7個物種線粒體基因組的基本特征見表1。
在文昌魚 7個物種的線粒體基因組中, 白氏文昌魚、佛羅里達文昌魚、矛形文昌魚和馬爾代夫側(cè)殖文昌魚 4個物種的基因排列完全相同; 尖刀偏文昌魚和偏文昌魚A TK-2007的基因排列相同; 而偏文昌魚線粒體基因組的基因排列獨具一格。因此, 從目前的線粒體基因組數(shù)據(jù)分析, 文昌魚線粒體基因組共有3種基因排列方式(圖2)。在3種基因排列方式中, 第一種基因排列方式(文昌魚屬和側(cè)殖文昌魚)與脊椎動物線粒體基因組的典型排列相比最為接近,僅有4個轉(zhuǎn)運RNA基因的重排[10]。因此, 文昌魚屬和側(cè)殖文昌魚線粒體基因組的基因排列方式代表了文昌魚原始的基因排列方式[11]。與此相比, 尖刀偏文昌魚和偏文昌魚A TK-20072的線粒體基因組發(fā)生3個基因或者基因區(qū)塊(cox3-nad3,W-A-C-Y和Q)的易位以及 1個基因區(qū)塊(L(UAG)-nad5-G-nad6)的倒位;偏文昌魚A. inferum線粒體基因組發(fā)生1個基因區(qū)塊(cox3-nad3)的易位、1個基因區(qū)塊(L(UAG)-nad5-G-nad6)的倒位和 1個轉(zhuǎn)運 RNA(Q)的易位并倒位。偏文昌魚屬 3個物種的線粒體基因組, 共有的“cox3-nad3”的易位和“L(UAG)-nad5-G-nad6”的倒位, 可以作為偏文昌魚線粒體基因組的共同衍征。
圖2 文昌魚線粒體基因組圖譜Fig. 2 Gene map of amphioxus mitochondrial genomes
在文昌魚線粒體基因組的蛋白質(zhì)編碼基因中,對于atp6、cob、cox2、cox3、nad2、nad3、nad4和nad6基因, 7個文昌魚線粒體基因組均以ATG作為起始密碼子; 對于atp8、cox1、nad1、nad4L和nad5基因, 存在GTG和ATG兩種起始密碼子。在文昌魚線粒體基因組中, 除了atp8、cox1、nad2和nad6基因的所有終止密碼子為完全終止密碼子外(TAA或者TAG), 余下的9個基因(atp6、cob、cox2、cox3、nad1、nad3、nad4、nad4L和nad5)均存在不完全的終止密碼子(TA-或者 T-); 而在 7個文昌魚線粒體基因組中,cox2基因的終止子全部為不完全終止子“T-”(表2)。文昌魚線粒體基因組中的7個蛋白質(zhì)編碼基因(cob、cox1、cox2、cox3、nad3、nad4和nad4L)編碼氨基酸數(shù)目相同, 分別為380、515、230、262、117、452和 91個; 其余 6個蛋白質(zhì)編碼基因編碼的氨基酸數(shù)目稍有差異(表2)。文昌魚7個線粒體基因組蛋白質(zhì)編碼基因所編碼氨基酸的數(shù)目及起始、終止密碼子見表2。
為了分析文昌魚線粒體基因組蛋白編碼基因的選擇壓力, 統(tǒng)計了白氏文昌魚、佛羅里達文昌魚、矛形文昌魚和尖刀偏文昌魚的13個蛋白編碼基因的同義替換率(Ks)和非同義替換率(Ka)。4個文昌魚線粒體基因組的13個蛋白質(zhì)編碼基因的Ka/Ks比值都遠遠低于1(介于0和0.3363之間), 顯示出較強的純化(負)選擇(圖3)。其中,nad4L基因的Ka/Ks均值最低(0.0019), 其次為cox1和cox2基因, 其Ka/Ks均值分別為 0.0103和 0.0160, 說明這些基因承受較強的選擇壓力和功能束縛; 而nad4基因的Ka/Ks均值最高(0.1653), 其次為atp8和nad2基因, 其Ka/Ks均值分別達到了 0.1237和 0.0933, 說明這些基因的選擇壓力較弱。
在種群遺傳的研究中, 分子標記的選擇是至關重要的, 以 7種文昌魚線粒體基因組數(shù)據(jù)作為數(shù)據(jù)群進行了種間基因差異位點分析, 同時以14條白氏文昌魚、21條佛羅里達文昌魚、11條矛形文昌魚和2條尖刀偏文昌魚作為數(shù)據(jù)群進行了種內(nèi)基因差異位點分析。7種文昌魚線粒體基因組13個蛋白質(zhì)編碼基因和2個核糖體RNA基因的差異位點分析詳見表3。cox1基因通常被用于barcoding分析和海洋生物類群的群體遺傳研究[16]。然而, 從分析的結(jié)果可以看出, 在15個主編碼基因中,cox1基因最為保守, 差異位點的比例為 37.86%, 這在群體遺傳研究中可能是不夠的。6個基因(cob、cox2、cox3、nad1、srRNA和lrRNA)差異位點的比例介于 40%~50%; 4個基因(atp6、nad3、nad4L和nad5)差異位點的比例介于50%~60%; 4個基因(atp8、nad2、nad4和nad6)差異位點的比例介于60%~70%(表3)。差異位點數(shù)最多的基因為nad5基因(1025個), 其次為nad4和nad2基因, 差異位點數(shù)分別達到814和646個。因此, 在文昌魚群體遺傳的研究中,nad5、nad4和nad2基因可以作為cox1基因輔助的分子標記。
表2 文昌魚線粒體基因組13個蛋白質(zhì)編碼基因的氨基酸長度及起始、終止密碼子Tab. 2 Amino acids number, initiation and termination codons in the 13 protein-coding genes of amphioxus mitochondrial genomes
圖3 白氏文昌魚、佛羅里達文昌魚、矛形文昌魚和尖刀偏文昌魚線粒體基因組13個蛋白質(zhì)編碼基因的Ka/Ks分析Fig. 3 The ratios of Nonsynonymous and synonymous substitutions rates (Ka/Ks) were estimated in all 13 protein-coding genes of B. belcheri, B. floridae, B. lanceolatum, and A. lucayanum mitochondrial genomes
從白氏文昌魚線粒體基因組主編碼基因的差異位點分析, 可以看出,srRNA和lrRNA基因最為保守,差異位點的比例分別為2.13%和2.24%; 差異位點數(shù)最多的基因為nad5基因(90個), 其次為cox1和nad2基因, 差異位點數(shù)分別為73和69個(表4)。因此, 在白氏文昌魚群體遺傳的研究中,nad5和nad2基因可以作為cox1基因輔助的分子標記。與白氏文昌魚線粒體基因組類似, 在佛羅里達文昌魚線粒體基因組主編碼基因中,srRNA和lrRNA基因最為保守, 差異位點的比例分別為6.74%和5.79%; 差異位點數(shù)最多的基因為nad5基因(164個), 其次為nad4、nad2和cox1基因, 差異位點數(shù)分別為162、151和148個(表5)。因此, 在佛羅里達文昌魚群體遺傳的研究中,nad5、nad4和nad2基因可以作為cox1基因輔助的分子標記。從矛形文昌魚線粒體基因組主編碼基因的差異位點分析, 可以看出,nad4基因的差異位點數(shù)最多(106個)(表6)。因此, 在矛形文昌魚群體遺傳的研究中,nad4基因是理想的分子標記。而在尖刀偏文昌魚線粒體基因組中, 差異位點數(shù)最多的基因為nad5基因(174個), 其次為nad4和cox1基因, 差異位點數(shù)分別為104和87個(表7)。因此, 在尖刀偏文昌魚群體遺傳的研究中,nad5和nad4基因可以作為cox1基因輔助的分子標記。
綜上所述, 在文昌魚群體遺傳的研究中,nad5、nad4和nad2基因是理想的分子標記, 可以作為cox1基因輔助的分子標記, 用于分析文昌魚不同群體之間的遺傳多樣性, 為其生物多樣性的保護及合理利用其生物資源提供更多保障。
表3 文昌魚線粒體基因組13個蛋白質(zhì)編碼基因和2個核糖體RNA基因的差異位點分析Tab. 3 Analysis of different loci of 13 protein-coding genes and two ribosomal RNA genes in amphioxus mitochondrial genomes
表4 白氏文昌魚線粒體基因組13個蛋白質(zhì)編碼基因和2個核糖體RNA基因的差異位點分析Tab. 4 Analysis of different loci of 13 protein-coding genes and two ribosomal RNA genes in B. belcheri mitochondrial genomes
表5 佛羅里達文昌魚線粒體基因組13個蛋白質(zhì)編碼基因和2個核糖體RNA基因的差異位點分析Tab. 5 Analysis of different loci of 13 protein-coding genes and two ribosomal RNA genes in B. floridae mitochondrial genomes
表6 矛形文昌魚線粒體基因組13個蛋白質(zhì)編碼基因和2個核糖體RNA基因的差異位點分析Tab. 6 Analysis of different loci of 13 protein-coding genes and two ribosomal RNA genes in B. lanceolatum mitochondrial genomes
表7 尖刀偏文昌魚線粒體基因組13個蛋白質(zhì)編碼基因和2個核糖體RNA基因的差異位點分析Tab. 7 Analysis of different loci of 13 protein-coding genes and two ribosomal RNA genes in A. lucayanum mitochondrial genomes
作者在51個文昌魚線粒體基因組全序列的基礎上, 全面分析了文昌魚線粒體基因組的基本特征、基因排列、蛋白質(zhì)編碼基因和差異位點等。文昌魚線粒體基因組長度介于14, 975bp和15, 146bp之間。7個文昌魚物種的線粒體基因組均編碼后生動物標準的37個基因。從目前的線粒體基因組數(shù)據(jù)分析, 文昌魚線粒體基因組共有 3種基因排列方式, 其中文昌魚屬和側(cè)殖文昌魚共有的基因排列, 與脊椎動物線粒體基因組的原始排列相比最為接近。因此, 文昌魚屬和側(cè)殖文昌魚屬線粒體基因組的基因排列方式代表了文昌魚原始的基因排列方式。與此相比, 尖刀偏文昌魚和偏文昌魚A.sp.A TK-20072的線粒體基因組發(fā)生3個基因或者基因區(qū)塊的易位以及 1個基因區(qū)塊的倒位; 偏文昌魚A. inferum線粒體基因組發(fā)生1個基因區(qū)塊的易位、1個基因區(qū)塊的倒位和1個轉(zhuǎn)運RNA的易位并倒位。白氏文昌魚、佛羅里達文昌魚、矛形文昌魚和尖刀偏文昌魚的13個蛋白編碼基因的同義替換率(Ks)和非同義替換率(Ka)。4個文昌魚線粒體基因組的13個蛋白質(zhì)編碼基因的Ka/Ks比值都遠遠低于1(介于0和0.3363之間), 顯示出較強的純化(負)選擇。文昌魚線粒體基因組種間和種內(nèi)基因差異位點和基因變異分析表明, 在文昌魚群體遺傳的研究中,nad5、nad4和nad2基因是理想的分子標記, 可以作為cox1基因輔助的分子標記, 用于分析文昌魚不同群體之間的遺傳多樣性, 為其生物多樣性的保護及合理利用其生物資源提供更多保障。
[1]Dellaporta S L, Xu A, Sagasser S, et al. Mitochondrial genome ofTrichoplax adhaerenssupports placozoa as the basal lower metazoan phylum[J]. Proceedings of the National Academy of Sciences of the United States of America, 2006, 103(23): 8751-8756.
[2]Helfenbein K G, Fourcade H M, Vanjani R G, et al.The mitochondrial genome ofParaspadella gotoiis highly reduced and reveals that chaetognaths are a sister group to protostomes[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(29): 10639-10643.
[3]Boore J L. Animal mitochondrial genomes[J]. Nucleic Acids Res, 1999, 27(8): 1767-1780.
[4]Boore J L, Brown W M. Big trees from little genomes:mitochondrial gene order as a phylogenetic tool[J].Current Opinion In Genetics & Development, 1998,8(6): 668-674.
[5]王義權, 方少華. 文昌魚分類學研究及展望[J]. 動物學研究, 2005, 26(6): 666-672.
[6]王奕華, 張士璀, 劉振輝. 青島文昌魚遺傳多樣性的RAPD分析[J]. 海洋水產(chǎn)研究, 2004, 25(3): 21-27.
[7]張士璀, 袁金鐸, 李紅巖. 文昌魚—研究脊椎動物起源和進化的模式動物[J]. 生命科學, 2001, 13(5):214-218.
[8]Thompson J D, Gibson T J, Plewniak F, et al. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Res, 1997, 25(24): 4876-4882.
[9]Nohara M, Nishida M, Nishikawa T. New complete mitochondrial DNA sequence of the lanceletBranchiostoma lanceolatum(Cephalochordata) and the identity of this species' sequences[J]. Zoological Science, 2005,22(6): 671-674.
[10]Boore J L, Daehler L L, Brown W M. Complete sequence, gene arrangement, and genetic code of mitochondrial DNA of the cephalochordateBranchiostoma floridae(Amphioxus) [J]. Molecular Biology and Evolution, 1999, 16(3): 410-418.
[11]Kon T, Nohara M, Yamanoue Y, et al. Phylogenetic position of a whale-fall lancelet (Cephalochordata) inferred from whole mitochondrial genome sequences[J].BMC Evolutionary Biology, 2007, 7: 127.
[12]Naylor G J, Brown W M. Amphioxus mitochondrial DNA, chordate phylogeny, and the limits of inference based on comparisons of sequences[J]. Systematic Biology, 1998, 47(1): 61-76.
[13]Nohara M, Nishida M, Miya M, et al. Evolution of the mitochondrial genome in cephalochordata as inferred from complete nucleotide sequences from two epigonichthys species[J]. Journal of Molecular Evolution,2005, 60(4): 526-537.
[14]Yang Z. PAML 4: phylogenetic analysis by maximum likelihood[J]. Mol Biol Evol, 2007, 24(8): 1586-1591.
[15]Rozas J, Sanchez-DelBarrio J C, Messeguer X, et al.DnaSP, DNA polymorphism analyses by the coalescent and other methods[J]. Bioinformatics, 2003, 19(18):2496-2497.
[16]Schindel D E, Miller S E. DNA barcoding a useful tool for taxonomists[J]. Nature, 2005, 435(7038): 17.
Analysis of the characteristics of mitochondrial genomes and exploration of molecular markers in amphioxus
SHEN Xin1,2, TIAN Mei1, MENG Xue-ping1, CHENG Han-liang1
(1. College of Marine Science, Huaihai Institute of Technology, Lianyungang 222005, China; 2. Institute of Oceanology, Chinese Academy of Sciences, Qingdao 266071, China
Apr., 20, 2010
Amphioxus; mitochondrial genome; genetic different loci; molecular marker
Mitochondrial genomes have been widely used in metazoan molecular phylogeny and genetic research.Amphioxus, as research model animals, occupies an important position in the origin and evolution of vertebrates.The basic characteristics of amphioxus mitochondrial genomes were fully revealed by our comprehensive analysis of 51 mitochondrial genome sequences from seven species. Amphioxus mitochondrial genomes contain 37 standard metazoan genes. Three types of gene arrangements were found in amphioxus mitochondrial genomes. Gene arrangements ofBranchiostomaandEpigonichthysare most similar to those of typical vertebrate mitochondrial genomes. Therefore, gene arrangement shared byBranchiostomaandEpigonichthysrepresents the ancestral amphioxus gene order. In contrast, gene rearrangements were found in three species of the genusAsymmetron. TheKa/Ksratios of the 13 amphioxus mitochondrial protein-coding genes were much lower than one (range between 0 and 0.3363), indicating a strong purifying selection (negative selection). The genetic variation analysis of main genes(13 protein coding genes and two ribosomal RNA genes) among and within amphioxus species shows that genesnad5,nad4andnad2are ideal molecular markers supplementary to thecox1gene, and will provide useful information on conservation of amphioxus biological diversity and the utilization of biological resources.
Q959.287
A
1000-3096(2011)07-0007-07
2010-04-20;
2010-11-18
國家自然科學基金資助項目(40906067); 江蘇省青藍工程人才基金資助項目(蘇教師[2010]27號); 江蘇省海洋生物技術重點建設實驗室研究基金資助項目(2009HS13); 淮海工學院自然科學基金資助項目(Z2009048)
申欣(1981-), 男, 講師, 博士, 主要從事海洋動物基因組學和蛋白質(zhì)組學研究, E-mail: shenthin@163.com
譚雪靜)