熊 鋼,彭英海,向先嘉,周先文,,王 佩,曾 丹,胡亞洲,王曉清
(1.湖南生物機(jī)電職業(yè)技術(shù)學(xué)院 生態(tài)養(yǎng)殖協(xié)同創(chuàng)新中心,湖南 長沙 410127;2.湘西土家族苗族自治州畜牧水產(chǎn)事務(wù)中心,湖南 吉首 416000;3.湖南農(nóng)業(yè)大學(xué),湖南 長沙 410128)
湘西呆鯉[1](Cyprinus carpiovar. Xiangxi)是湖南省湘西山區(qū)農(nóng)民在長期的稻田養(yǎng)魚模式中選育出的一個地方鯉魚品種,該魚具有適應(yīng)性強(qiáng)、抗病力強(qiáng)、魚性溫順、逃逸率低等特點。近年來,湘西土家族苗族自治州畜牧水產(chǎn)事務(wù)中心與湖南農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院合作開展了湘西呆鯉品種的繁殖、保種和選育推廣工作,以提高“湘西呆鯉”良種的生產(chǎn)能力和質(zhì)量水平[2],為稻田綜合種養(yǎng)技術(shù)的發(fā)展提供了有力的技術(shù)支撐。
線粒體全基因組(mtDNA)具有廣泛的種內(nèi)和種間多態(tài)性,為母性遺傳,親緣關(guān)系較近的物種之間的進(jìn)化比核基因進(jìn)化速度快,是從分子水平研究種群遺傳學(xué)和進(jìn)化遺傳學(xué)的理想對象[3]。而且,脊椎動物線粒體DNA具備結(jié)構(gòu)緊密、無重組、編碼效率高、進(jìn)化速率快和無組織特異性等特點,廣泛地應(yīng)用于系統(tǒng)發(fā)育、物種分類和群體遺傳進(jìn)化等領(lǐng)域中[4]。例如:曲憲成等[5]和孫超等[6]以線粒體COI基因為對象分別研究了千島湖細(xì)鱗鲴和光滑河藍(lán)蛤的遺傳多樣性;頡曉勇等[7]以線粒體Cytb和D-loop基因分析了羅非魚選育群體遺傳結(jié)構(gòu),胡曉天等[8]則基于線粒體ATP6基因序列研究了30種作物的系統(tǒng)發(fā)育?;驕y序技術(shù)的發(fā)展為線粒體全基因組測序提供了更為便捷的方法,例如毛明光等[9]通過二代基因測序技術(shù)獲得了太平洋鱈(Gadus macrocephalus)線粒體基因組全序列?;诖?,研究擬通過第二代測序技術(shù)獲取湘西呆鯉線粒體全基因組序列,并對該線粒體全基因組序列的結(jié)構(gòu)特征進(jìn)行分析,為進(jìn)一步研究湘西呆鯉的遺傳進(jìn)化和分類提供依據(jù)。
試驗所用的湘西呆鯉樣本取自湖南湘西自治州永順縣小溪鄉(xiāng)小溪村。
取湘西呆鯉鰭條,采用天澤基因柱式動物DNA提取試劑盒提取湘西呆鯉總DNA。總DNA用1%瓊脂糖凝膠電泳檢測,-20℃保存?zhèn)溆谩?/p>
DNA樣品檢測合格后,使用Covaris超聲波破碎儀隨機(jī)打斷,再經(jīng)末端修復(fù)、加A尾、加測序接頭、純化、PCR擴(kuò)增等步驟完成整個文庫制備工作,使用Qsep100對文庫的插入片段大小進(jìn)行檢測,合格后使用Illumina高通量測序平臺(HiSeq X)進(jìn)行測序。
利用SPAdes v3.11.1(http://cab.spbu.ru/software/spades/)拼接軟件對優(yōu)化序列進(jìn)行多個 Kmer參數(shù)的拼接,利用MITOS軟件對線粒體基因進(jìn)行預(yù)測,分別計算線粒體全基因組、蛋白編碼基因、rRNA基因的堿基組成。
使用在線軟件(http://rna.tbi.univie.ac.at )[10]對線粒體 tRNA的二級結(jié)構(gòu)進(jìn)行預(yù)測。
為了分析湘西呆鯉的系統(tǒng)發(fā)育關(guān)系, 以目的基因Blast后從GenBank中下載相關(guān)基因序列,使用MEGA 6.0軟件構(gòu)建進(jìn)化樹。
研究采用第二代基因測序技術(shù),獲得湘西呆鯉線粒體全基因組序列(基因號:MN544290), 其長度為16 581 bp。全基因組序列包含了13個蛋白編碼基因(PCGs)、2個rRNA基因和22個tRNA基因(圖1)。H-鏈編碼6個tRNA和ND6基因,L-鏈則編碼其余基因和tRNA,H-鏈和L-鏈的編碼基因與其他鯉魚相同。
圖1 湘西呆鯉線粒體基因組結(jié)構(gòu)
湘西呆鯉線粒體全基因組中堿基含量由高到低依次為:A(31.88%) > C(27.50%) > T(24.86%) > G(15.77%),A+T含量達(dá)到56.74%,明顯高于C+G的含量;以湘西呆鯉線粒體全基因組序列在基因庫Blast分析并下載15種鯉魚線粒體全基因組序列,分析發(fā)現(xiàn)15種鯉魚線粒體基因全長在16 576~16 597 bp范圍內(nèi);A+T含量在56.65%~57.41%之間,均呈現(xiàn)AT偏向性(表1);其中A+T含量最多的金魚(Carassius auratus),A+T含量最少的興國紅鯉 (Cyprinus carpio xingguonensis)。
表1 湘西呆鯉及其他物種線粒體基因組堿基組成比較
湘西呆鯉線粒體基因組上的ND6基因在H鏈上編碼蛋白,ND1、ND2、COX1、COX2、ATP8、ATP6、COX3、ND3、ND4L、ND4、ND5和Cytb在L鏈 上編碼蛋白。9個編碼基因終止密碼子為TAG,4個編碼基因終止密碼子為TAA(表2)。其中在tRNA-Pro和tRNA-Phe之間存在一個927 bp的D-loop序列片段。
線粒體基因組中的非編碼區(qū)不參與編碼基因,為可調(diào)節(jié)線粒體DNA復(fù)制和轉(zhuǎn)錄的片段,主要分布于L-鏈復(fù)制起始區(qū)和各個tRNA基因之間。根據(jù)非編碼區(qū)結(jié)構(gòu)組成和分布位置的不同,非編碼區(qū)可分為基因間隔序列區(qū)和基因序列重疊區(qū)。在湘西呆鯉線粒體中共尋找到10處重疊區(qū),序列總長度為50 bp;重疊堿基數(shù)最長為17 bp,位于tRNA-Glu基因和Cytb基因之間;重疊堿基數(shù)最短的為1 bp(表2)。
對湘西呆鯉線粒體22個tRNA基因的定位以及二級結(jié)構(gòu)進(jìn)行預(yù)測分析,結(jié)果表明,22個tRNA基因長度為67~76 bp,平均長度為71.09 bp;最短的基因是tRNA-Cys,最長的基因是tRNA-Leu和tRNA-Lys,均為76 bp。tRNA二級結(jié)構(gòu)預(yù)測結(jié)果顯示,tRNAGlu、tRNA-Lys、tRNA-Ser、tRNA-Met、tRNA-Thr、tRNA-Trp和tRNA-His等22個tRNA基因形成的三葉草結(jié)構(gòu),其中“環(huán)”結(jié)構(gòu)長度為7~16 bp,“莖”結(jié)構(gòu)長度為3~7 bp,如圖2所示。
圖2 部分tRNA二級結(jié)構(gòu)預(yù)測圖
對線粒體全長基因組進(jìn)行同源性分析發(fā)現(xiàn),16種鯉魚的同源性在89.4%~99.8%之間;興國紅鯉與錦鯉、興國紅鯉與荷包紅鯉、荷包紅鯉與錦鯉、彩鯉與珠江鯉之間的同源性最大,均為99.8%,湘西呆鯉與Labeo catla的同源性最小,為89.4%(表3)。以D-loop區(qū)進(jìn)行同源性分析,結(jié)果如表4所示,湘西呆鯉與15種鯉魚之間的D-loop區(qū)同源性在87.3%~98.8%之間,而線粒體全長基因同源性在89.4%~99.5%之間;大眼鯉與烏原鯉的線粒體全長基因同源性為98.0%,二者的D-loop區(qū)同源性為97.9%,除此之外,其他15種鯉魚之間的線粒體全長基因同源性與D-loop區(qū)同源性均相同。
表3 基于線粒體全長基因組同源性 (%)
表4 基于D-loop片段序列同源性 (%)
以線粒體上D-loop序列,采用NJ(Neighborjoining)法構(gòu)建16種魚類的系統(tǒng)進(jìn)化樹,如圖3所示,彩鯉、烏原鯉、興國紅鯉、荷包紅鯉、大眼鯉和金魚聚成一大簇,建鯉和桂林鯉、尖鰭鯉和甌江鯉魚、珠江鯉和三角鯉、錦鯉和三倍體鯉分別成簇,湘西呆鯉和L. catla(分布于印度一種鯉魚)都單獨成枝,湘西呆鯉與L. catla獨立于各簇之外,其中湘西呆鯉與錦鯉和三倍體鯉一簇更為鄰近。
圖3 基于D-loop片段序列構(gòu)建的NJ進(jìn)化樹
目前,現(xiàn)生魚類中最大的科是鯉科,大約包括210屬2 100種,分布于歐亞大陸、東印度群島、北美和非洲,在東亞大陸最為豐富,我國有122屬600多種[11]。在魚類分類中,傳統(tǒng)的形態(tài)學(xué)對性狀的數(shù)據(jù)處理分析中,主要利用數(shù)理統(tǒng)計分析軟件進(jìn)行形態(tài)學(xué)數(shù)據(jù)的聚類分析,隨著現(xiàn)代分子生物學(xué)技術(shù)的發(fā)展,分子群體遺傳學(xué)數(shù)據(jù)分析方法和處理軟件應(yīng)運而生[12]。例如王成輝等[13]用限制性內(nèi)切酶對4種紅鯉的線粒體DNA(mtDNA)進(jìn)行限制性片段長度多態(tài)性(RFLP)分析,在此基礎(chǔ)上推算了各種紅鯉的起源和分化時間。
基因進(jìn)化的速率受選擇(selection)和突變(mutation)的影響[14]。魚類的線粒體基因組同其他脊椎動物一樣極為保守[15]。線粒體基因組各區(qū)域承擔(dān)不同的功能,在進(jìn)化中受到不同強(qiáng)度的選擇壓力,因而其進(jìn)化速率和系統(tǒng)發(fā)育信息也存在差異[16]。毛明光等[9]以鱈形目下幾種鱈為研究對象,以品種間線粒體基因組全序列和Cytb基因構(gòu)建的進(jìn)化樹就存在一定差異。潘賢輝等[17]分別以線粒體D-loop區(qū)和COI基因分析全州禾花鯉(Quanzhou Procypris merus)、融水禾花鯉(Rongshui P. merus)和野生鯉魚群體的遺傳多樣性和系統(tǒng)進(jìn)化關(guān)系,結(jié)果也存在差異。筆者的研究也發(fā)現(xiàn),以線粒體基因組全序列與D-loop片段序列分析湘西呆鯉與其他15種鯉魚之間的同源性和進(jìn)化樹,其結(jié)果存在一定差異。
線粒體全基因組的進(jìn)化速度比核基因快[3],而線粒體全基因組上的D-loop片段序列則比線粒體全基因組進(jìn)化更快。因此,該研究在分析線粒體全基因組和D-loop片段序列同源性基礎(chǔ)上,采用D-loop片段序列構(gòu)建的系統(tǒng)發(fā)育樹更能從分子角度呈現(xiàn)出湘西呆鯉的系統(tǒng)進(jìn)化關(guān)系。