李 娟, 李 虎,2*, 霍科科
(1.陜西理工大學(xué) 生物科學(xué)與工程學(xué)院, 陜西 漢中 723000;2.陜西省資源生物重點(diǎn)實(shí)驗(yàn)室, 陜西 漢中 723000)
蚜蠅,又稱訪花蚜蠅,是蚜蠅科(Syrphidae)昆蟲(chóng)的總稱,全世界已知約有3亞科230屬6000余種,廣泛分布于世界各地[1]。成蟲(chóng)具有訪花習(xí)性,幼蟲(chóng)的捕食范圍較為廣泛。通常,管蚜蠅亞科幼蟲(chóng)寄生在枯木中,食用土壤、池塘和溪流中腐爛的植物和動(dòng)物殘?bào)w[2-3];巢穴蚜蠅亞科的幼蟲(chóng)在螞蟻巢穴里寄居[4];蚜蠅亞科幼蟲(chóng)具有捕食性,捕食蚜蟲(chóng)、薊馬和其他刺吸植物的害蟲(chóng)[5-7]。因此蚜蠅與人類(lèi)生產(chǎn)關(guān)系密切。
蚜蠅科昆蟲(chóng)系統(tǒng)發(fā)育進(jìn)化關(guān)系,多采用形態(tài)學(xué)形狀和單個(gè)基因或少數(shù)幾個(gè)基因相結(jié)合的方法進(jìn)行研究。傳統(tǒng)分類(lèi)學(xué)鑒定需要相當(dāng)高的技能和分類(lèi)學(xué)專(zhuān)長(zhǎng),對(duì)于某些物種之間,尤其是形態(tài)相似性較高的物種,在形態(tài)鑒定過(guò)程中會(huì)出現(xiàn)很大的困難[8]。由于不同基因的進(jìn)化速率和保守性的差異,在利用單個(gè)基因和少數(shù)幾個(gè)基因分析不同階元的系統(tǒng)發(fā)育時(shí),結(jié)果往往是有差異的。近年來(lái)隨著生物技術(shù)的快速發(fā)展,測(cè)序成本不斷降低,使得線粒體基因組全序列被廣泛地應(yīng)用于種群結(jié)構(gòu)和支序關(guān)系的研究。
線粒體基因組全序列被看做是一種很有前途的新工具,可用于深層理解昆蟲(chóng)的系統(tǒng)遺傳學(xué)[9]。昆蟲(chóng)線粒體基因組全序列具有母系遺傳、基因組成穩(wěn)定、基因排列順序相對(duì)保守以及極少發(fā)生重組等特點(diǎn)[10],因而被廣泛應(yīng)用于動(dòng)物的起源、演化和分類(lèi),以及系統(tǒng)進(jìn)化和親緣關(guān)系的研究[11]。截止2018年9月,通過(guò)檢索美國(guó)國(guó)立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)的GenBank數(shù)據(jù)庫(kù)和查閱文獻(xiàn)資料,已完成線粒體基因組全序列測(cè)序的蚜蠅共有6種:Ocyptamussativus(登錄號(hào):KT272862)[12]、Syrphidae sp.(登錄號(hào):KM244713)[13]、黑帶蚜蠅Episyrphusbalteatus(登錄號(hào):KU351241)[14]、大灰優(yōu)蚜蠅Eupeodescorolla(登錄號(hào):KU379658)[14]、大角類(lèi)蚜蠅Simosyrphusgrandicornis(登錄號(hào):DQ866050)[9]和長(zhǎng)尾管蚜蠅Eristalistenax[15],其中Syrphidae sp.和大灰優(yōu)蚜蠅Eupeodescorolla的線粒體基因組序列還不完整。
本文通過(guò)對(duì)現(xiàn)有的線粒體基因組全序列進(jìn)行比較分析,總結(jié)蚜蠅科昆蟲(chóng)線粒體基因組全序列的結(jié)構(gòu)特征,并構(gòu)建基于線粒體基因組全序列的系統(tǒng)發(fā)育關(guān)系,驗(yàn)證并討論當(dāng)前的分類(lèi)系統(tǒng)。
Tautz等[16]首次提出用DNA序列作為生物分類(lèi)的主要依據(jù),即DNA分類(lèi)學(xué)。Hebert[17]等進(jìn)一步提出DNA條形碼計(jì)劃,并指出線粒體基因細(xì)胞色素C氧化酶I(COI)可以作為全球生物識(shí)別系統(tǒng)的核心。COI基因可以很好地用于分析科與科之間的系統(tǒng)發(fā)育關(guān)系[18],但對(duì)于同種不同群體之間的系統(tǒng)發(fā)育關(guān)系的分析仍存在一定問(wèn)題[19]。一個(gè)完整的線粒體基因組全序列可以提供更豐富的系統(tǒng)遺傳信息,因此可能比單個(gè)基因或多個(gè)基因在解決系統(tǒng)發(fā)育和進(jìn)化關(guān)系上具有更明顯的優(yōu)勢(shì)[20]。隨著GenBank數(shù)據(jù)庫(kù)中線粒體基因組全序列的不斷補(bǔ)充,大量的研究結(jié)果表明,線粒體基因組全序列可為深層次的分析生物系統(tǒng)發(fā)育和進(jìn)化關(guān)系提供更充分的分子理論依據(jù)。
線粒體基因組全序列可用于昆蟲(chóng)的系統(tǒng)發(fā)育關(guān)系重建、物種和行為起源與進(jìn)化、種群遺傳變異分化、近緣種以及種下分類(lèi)單元的鑒定等,其中應(yīng)用于鱗翅目、鞘翅目等昆蟲(chóng)的系統(tǒng)進(jìn)化關(guān)系和DNA條形碼等研究領(lǐng)域已經(jīng)取得了許多令人矚目的成果。張敏等[21]通過(guò)對(duì)小紅珠絹蝶線粒體基因組全序列分析蝶類(lèi)高級(jí)階元系統(tǒng)發(fā)育關(guān)系,其研究結(jié)果與傳統(tǒng)的分類(lèi)學(xué)結(jié)果基本一致,支持絹蝶科物種歸為絹蝶亞科;絹蝶亞科、鋸鳳蝶亞科和鳳蝶亞科屬于鳳蝶科,并且絹蝶亞科與鋸鳳蝶亞科為姊妹群。楊洪等[22]通過(guò)對(duì)煙蚜線粒體基因組全序列進(jìn)行系統(tǒng)發(fā)育分析,結(jié)果證實(shí)了蚜亞科和長(zhǎng)管蚜亞科的單系性。Timmermans等[23]基于53個(gè)線粒體基因組全序列的12個(gè)編碼蛋白基因的聯(lián)合數(shù)據(jù)對(duì)鞘翅目亞目間的系統(tǒng)發(fā)育關(guān)系進(jìn)行了探討,結(jié)果表明肉食亞目與藻食亞目互為姊妹群,多食亞目圓花蚤科(Scirtidae)在鞘翅目亞目的基部,叩甲系和扁甲系為單系,叩甲系與多食亞目的其他4個(gè)系所形成的進(jìn)化枝形成姊妹群。楊秀帥[24]基于線粒體基因組全序列數(shù)據(jù)獲得的夜蛾總科系統(tǒng)發(fā)育關(guān)系,支持最新的夜蛾總科六科系統(tǒng)和弄蝶科屬于鳳蝶總科。
圖1 雙翅目昆蟲(chóng)線粒體基因組
蚜蠅科線粒體基因組包含37個(gè)編碼基因,其中包括22個(gè)轉(zhuǎn)移RNA基因,13個(gè)蛋白編碼基因(PCGs)、2個(gè)核糖體RNA基因和非編碼控制區(qū),與雙翅目昆蟲(chóng)的線粒體基因組特點(diǎn)相同(圖1)[25];其中有23個(gè)基因在J鏈上編碼,14個(gè)基因在N鏈上編碼,符合昆蟲(chóng)線粒體基因組結(jié)構(gòu)特點(diǎn)[26]。13個(gè)蛋白編碼基因,其中9個(gè)基因位于J鏈,4個(gè)基因位于N鏈。由GenBank數(shù)據(jù)庫(kù)已知的5種蚜蠅科昆蟲(chóng)線粒體基因組全序列長(zhǎng)度以及長(zhǎng)尾管蚜蠅線粒體基因組全序列的長(zhǎng)度進(jìn)行比較分析(表1),可得出蚜蠅科昆蟲(chóng)線粒體基因組全序列長(zhǎng)度約在11 583~16 175 bp之間,平均長(zhǎng)度為15 088 bp。其中未知種Syrphidae sp.的線粒體基因組全序列最短,為11 583 bp,黑帶蚜蠅的線粒體基因組全序列最長(zhǎng),為16 175 bp[13-14]。
對(duì)線粒體基因組全序列中堿基A、T、G、C的組成進(jìn)行比較分析(表1)發(fā)現(xiàn),G的含量均低于C的含量(G%
表1 6種蚜蠅線粒體基因組全序列比較
通常,線粒體基因組全序列堿基組成特征可用3個(gè)參數(shù)表示,即A+T含量、AT偏斜和GC偏斜,AT偏斜與GC偏斜分別使用公式AT-skew=(A-T)/(A+T)、GC-skew=(G-C)/(G+C)來(lái)計(jì)算[27]。蚜蠅科昆蟲(chóng)線粒體基因組全序列在堿基組成中表現(xiàn)出很強(qiáng)的AT偏向性((A+T)%>(G+C)%),對(duì)這6種蚜蠅科昆蟲(chóng)線粒體基因組全序列計(jì)算得出,大角類(lèi)蚜蠅Simosyrphusgrandicornis和黑帶蚜蠅Episyrphusbalteatus的線粒體基因組中A+T含量均為80.83%,Ocyptamussativus為80.41%,Syrphidae sp.為80.29%,大灰優(yōu)蚜蠅Eupeodescorolla為80.18%,長(zhǎng)尾管蚜蠅EristalistenaxA+T含量為80.1%[15]。
通過(guò)比對(duì)發(fā)現(xiàn),很多目昆蟲(chóng)的線粒體基因組基因重排現(xiàn)象非常普遍,例如鱗翅目、半翅目、纓翅目等[28-30]。不同物種基因重排排序方式可能不同,例如在鱗翅目中云南蝠蛾的線粒體基因組排序方式類(lèi)似于果蠅,而不同于家蠶[31]。目前已測(cè)序的蚜蠅科昆蟲(chóng)線粒體基因組全序列中,并未發(fā)現(xiàn)基因重排現(xiàn)象。蚜蠅科昆蟲(chóng)線粒體基因組中出現(xiàn)了基因重疊和基因間隔,重疊范圍大多在1~7 bp之間,最長(zhǎng)的基因重疊區(qū)域位于atp8和atp6、nad4和nad4l之間?;蜷g隔的間隔距離范圍較大且數(shù)量多,如黑帶蚜蠅Episyrphusbalteatus在22個(gè)不同的位置上出現(xiàn)基因間隔,間隔范圍為1~60 bp,長(zhǎng)尾管蚜蠅Eristalistenax在20個(gè)不同的位置上出現(xiàn)了基因間隔,間隔范圍為1~37 bp,大灰優(yōu)蚜蠅Eupeodescorolla間隔基因出現(xiàn)在19個(gè)不同的位置,間隔范圍為2~47 bp等。在大灰優(yōu)蚜蠅Eupeodescorolla和黑帶蚜蠅Episyrphusbalteatus中最長(zhǎng)的間隔基因位于trnK和trnD之間,其次是位于trnE和trnF之間[14]。間隔基因的出現(xiàn)可能有利于儲(chǔ)存較多的遺傳信息,也可能會(huì)增加變異概率,有利于生物進(jìn)化。
圖2 tRNA典型的二級(jí)結(jié)構(gòu)
黑帶蚜蠅Episyrphusbalteatus和大灰優(yōu)蚜蠅Eupeodescorolla線粒體基因組中,所有tRNA基因的二級(jí)結(jié)構(gòu)都可折疊成典型的三葉草結(jié)構(gòu)(圖2)[32];所有的tRNA的二氫尿苷(DHU)臂是一個(gè)大環(huán),而不是一個(gè)保守的莖環(huán)結(jié)構(gòu);trnM基因序列最保守,沒(méi)有任何核苷酸變化;出現(xiàn)堿基錯(cuò)配現(xiàn)象[14]。rRNA包括rrnl和rrns,其結(jié)構(gòu)特點(diǎn)未見(jiàn)報(bào)道。
大多數(shù)線粒體蛋白編碼基因的起始密碼子都是ATN,與之不同的是,長(zhǎng)尾管蚜蠅Eristalistenax[15]的COI和ND1的起始密碼子為T(mén)TG,COIII使用的起始密碼子是TGG。除了大灰優(yōu)蚜蠅中ND5的終止密碼子是一個(gè)不完全的TA[14],其余所有的蛋白編碼基因使用的終止密碼子都為T(mén)AA。在黑帶蚜蠅Episyrphusbalteatus和大灰優(yōu)蚜蠅Eupeodescorolla線粒體基因組全序列中,由于Leu、Ile、Phe和Met是最常被編碼的氨基酸,因此TTA(Leu)、ATT(Ile)、TTT(Phe)和ATA(Met)是最常見(jiàn)的密碼子[14]。4個(gè)物種蛋白編碼基因的AT偏斜和GC偏斜如表2所示[14],僅有大灰優(yōu)蚜蠅Eupeodescorollae的AT偏斜為正數(shù),其余均為負(fù)數(shù),并且GC偏斜的絕對(duì)值都大于AT偏斜。
表2 PCGs核苷酸長(zhǎng)度及偏斜值
選取8個(gè)物種線粒體基因組全序列構(gòu)建系統(tǒng)發(fā)育樹(shù),包括來(lái)自蚤蠅科Phoridae、鼓翅蠅科Sepsidae和佛蠅科Fergusoninidae的3個(gè)外群,這8個(gè)物種均屬于雙翅目,親緣關(guān)系較近[14],其中蚤蠅科和蚜蠅科屬于無(wú)縫組,鼓翅蠅科和佛蠅科屬于有縫組。檢索GenBank數(shù)據(jù)庫(kù)已有的線粒體基因組全序列,使用最大似然法(ML)分析系統(tǒng)發(fā)育樹(shù)(圖3)。
圖3 基于線粒體基因組全序列構(gòu)建的最大似然法系統(tǒng)發(fā)育關(guān)系
3個(gè)外群中,F(xiàn)ergusoninataylori(佛蠅科Fergusoninidae)最先分出,位于樹(shù)的根部,接著Megaseliascalaris(蚤蠅科Phoridae)和Nemopodamamaevi(鼓翅蠅科Sepsidae)分出并聚在一起構(gòu)成姐妹群關(guān)系,蚜蠅科Syrphidae與(蚤蠅科Phoridae+鼓翅蠅科Sepsidae)構(gòu)成姊妹群關(guān)系。5種蚜蠅聚類(lèi)成一大支,構(gòu)成單系,系統(tǒng)發(fā)育關(guān)系為(Syrphidae sp.+(Ocyptamussativus+(大灰優(yōu)蚜蠅Eupeodescorollae+(大角類(lèi)蚜蠅Simosyrphusgrandicornis+黑帶蚜蠅Episyrphusbalteatus)))),其中大角類(lèi)蚜蠅Simosyrphusgrandicornis和黑帶蚜蠅Episyrphusbalteatus構(gòu)成姊妹群關(guān)系。
截至2018年9月,檢索GenBank數(shù)據(jù)庫(kù)和查閱相關(guān)文獻(xiàn)發(fā)現(xiàn),已測(cè)出線粒體基因組全序列的蚜蠅科昆蟲(chóng)共有6種,其中基因組完整的4種,不完整的2種。僅占蚜蠅科昆蟲(chóng)總數(shù)極小的比例,蚜蠅科昆蟲(chóng)線粒體基因組研究仍有很大的空間。
對(duì)這6種蚜蠅科昆蟲(chóng)線粒體基因組進(jìn)行比較分析,發(fā)現(xiàn)蚜蠅科昆蟲(chóng)線粒體基因組包含37個(gè)編碼基因(其中包括22個(gè)轉(zhuǎn)移RNA基因,13個(gè)蛋白編碼基因(PCGs)、2個(gè)核糖體RNA基因)和非編碼區(qū),在堿基組成上具有很強(qiáng)的AT偏向性,未出現(xiàn)基因重排現(xiàn)象以及tRNA基因的二級(jí)結(jié)構(gòu)為典型的三葉草結(jié)構(gòu)等,比較符合昆蟲(chóng)線粒體基因組的特點(diǎn)[26]。
基因重排現(xiàn)象在很多目的昆蟲(chóng)中都有發(fā)生,例如鱗翅目、半翅目、纓翅目等[28-30]。同樣,在雙翅目中也出現(xiàn)了基因重排,均出現(xiàn)在長(zhǎng)角亞目中[26],例如在蚊科中伊蚊的trnA與trnR發(fā)生重排,形成trnR-trnA[33],但蚜蠅科目前仍未發(fā)現(xiàn)基因重排現(xiàn)象,這可能與雙翅目昆蟲(chóng)線粒體基因的保守性有關(guān)[25],也可能是目前所測(cè)得的蚜蠅科昆蟲(chóng)線粒體基因組的數(shù)據(jù)過(guò)少,還不能充分反映該科物種線粒體基因的排列順序。
在密碼子使用方面,絕大多數(shù)線粒體蛋白編碼基因的起始密碼子都是標(biāo)準(zhǔn)的三聯(lián)體ATN,個(gè)別蛋白編碼基因使用特殊的起始密碼子如TTG、TGG,研究表明,這種特殊的起始密碼子可以減小基因間隔區(qū),避免相鄰基因發(fā)生重疊,可轉(zhuǎn)錄成為mRNA后經(jīng)過(guò)RNA編輯轉(zhuǎn)換成正常的起始密碼子,然后翻譯成特定的蛋白質(zhì)[34]。終止密碼子為T(mén)A和不完整的T,有研究者[35]推測(cè)不完整的T會(huì)在轉(zhuǎn)錄后通過(guò)向mRNA的3′端添加A進(jìn)行多聚腺苷酸化,進(jìn)而轉(zhuǎn)化為完整的終止密碼子而完成轉(zhuǎn)錄終止。
本研究結(jié)果支持蚜蠅科的單系性,這與Pu等[14]的研究結(jié)果相同。Li等[15]利用線粒體基因組全序列中所有的蛋白編碼基因?qū)?個(gè)物種進(jìn)行系統(tǒng)發(fā)育分析,結(jié)果同樣支持了蚜蠅科的單系性,并且蚜蠅科與頭蠅科Pipunculidae是姊妹群關(guān)系。張卓等[36]利用COI~COII序列對(duì)4個(gè)不同地區(qū)的黑帶蚜蠅種群進(jìn)行分析,發(fā)現(xiàn)產(chǎn)生了遺傳差異并且已經(jīng)具有明顯的遺傳分化。張宏杰等[37]對(duì)管蚜蠅族Eristalini的7種蚜蠅Cty b基因序列進(jìn)行分析,表明管蚜蠅族的4個(gè)屬為單系且條胸蚜蠅屬Helophilus和寬盾蚜蠅屬Phytomia的親緣關(guān)系相對(duì)較遠(yuǎn)。
蚜蠅科昆蟲(chóng)線粒體基因組全序列已測(cè)出的種數(shù)較少,在生物系統(tǒng)發(fā)育關(guān)系等方面的分析主要以單個(gè)基因或多個(gè)基因序列為主導(dǎo)。在系統(tǒng)發(fā)育分析中使用頻率較高的線粒體基因有COI基因、COII基因、Cty b基因等。因此,應(yīng)重視對(duì)蚜蠅科昆蟲(chóng)線粒體基因組的研究,以期獲得更多的線粒體基因組數(shù)據(jù)來(lái)探討蚜蠅科系統(tǒng)發(fā)育關(guān)系。