丁曉飛,魏久鋒,高曉云,劉迎香,陳 超,趙 清
(山西農業(yè)大學 植物保護學院,山西 太谷 030801)
蠋蝽(Arma custosFabricius)又名蠋敵,隸屬于半翅目(Hemiptera)蝽科(Pentatomidae)益蝽亞科(Asopinae)蠋蝽屬,在我國各地區(qū)廣泛分布,其適應能力較強[1]。蠋蝽作為農林業(yè)領域上的一種重要的捕食性天敵昆蟲,以鞘翅目和鱗翅目等多種害蟲的幼蟲為食[2]。研究表明,蠋蝽對草地貪夜蛾(Spodoptera frugiperda)、斜紋夜蛾(Spodoptera litura)以及小菜蛾(Plutella xylostella)等鱗翅目害蟲的幼蟲具有較好的防治效果[3]。
昆蟲線粒體基因組是一個長15~20 kb的雙鏈共價閉合的環(huán)狀DNA分子,共37個基因,包括13個蛋白編碼基因(PCGs)、22個轉運RNA基因(tRNAs)、2個核糖體RNA基因(rRNAs)和1個控制區(qū)[4-5]。其中,13個蛋白編碼基因(ATP6、ATP8、COX1、COX2、COX3、ND1、ND2、ND3、ND4、ND4L、ND5、ND6和Cytb)的蛋白質產物對線粒體氧化磷酸化過程至關重要[6]。由于線粒體基因組具有大量的遺傳以及各種系統(tǒng)進化發(fā)育信息,被廣泛地應用于物種鑒定、系統(tǒng)進化發(fā)育、譜系生物地理學和基因組水平分子進化等領域的研究[7-9]。已有研究很多是基于單個基因或部分基因對物種進行系統(tǒng)發(fā)育分析,尤其是COX1基因由于分子量最大、功能結構域最保守,被廣泛應用于不同分類階元層次上系統(tǒng)進化分析[10-11];COX2、ND2和ND5基因進化速率較快,經常應用于親緣關系較近的進化分析,可解決傳統(tǒng)分類技術所不能解決的問題[12]。
近年對昆蟲的密碼子偏好性研究主要集中于目級階元及以上(半翅目、膜翅目、鱗翅目和雙翅目等),利用線粒體基因組中的某些基因或聯(lián)合一些基因進行分析[13-14]。張玉波等[15]對半翅目線粒體的COX1基因進行密碼子偏好性聚類分析,表明同一單系群里進化越快的昆蟲其COX1基因的密碼子偏好性越強。BEHURA等[16]通過比較分析雙翅目與膜翅目22種昆蟲基因組序列的密碼子使用模式,發(fā)現雙翅目偏好使用G/C結尾,而膜翅目偏好A/T結尾。GUAN等[17]對蜻蜓目線粒體基因組中密碼子使用綜合分析,發(fā)現豆娘的密碼子使用偏好比蜻蜓弱,可能是由于蜻蜓比豆娘具有更高效的線粒體基因表達水平。但是針對半翅目益蝽亞科這類天敵昆蟲的詳細研究還未見報道,僅有MU等[18]對蠋蝽和益蝽進行測序及構建異翅亞目系統(tǒng)發(fā)育樹與姜培[19]基于線粒體基因組構建異翅亞目系統(tǒng)發(fā)育樹,但二者對于密碼子的偏好性研究只基于同義密碼子相對使用度來研究,研究方法相對單一。
本研究通過分析蠋蝽線粒體基因組13個蛋白編碼基因,并利用生物信息學方法探討該物種以及益蝽亞科的密碼子偏好的使用模式,旨在為蝽科提供一些基本的生物學信息,增加蠋蝽的一些相關基因信息,探明該物種的進化機制及其進化關系;同時,蠋蝽作為重要的天敵昆蟲,對其進行基因水平的研究將為該種的生物防治應用提供一定的理論基礎。
蠋蝽及其他蝽科物種的登錄號如表1所示。
表1 蠋蝽及其他蝽科物種的登錄號Tab.1 The accession numbers of Arma custos and other Pentatomidae species
從國家生物技術信息中心(NCBI)公開的GenBank數據庫中檢索蠋蝽及其他蝽科的線粒體基因組序列(https://www.ncbi.nlm.nih.gov/)(表1),蠋蝽線粒體基因組序列的GenBank登錄號為NC_051562,使用Geneious 8.0.4[20]軟件提取其線粒體基因組的13條蛋白編碼序列。
1.2.2 密碼子偏好性分析 在軟件MEGA 7.0 中計算益蝽亞科8個物種(蠋蝽、藍蝽、峰疣蝽、黑益蝽、益蝽、黑曙厲蝽、叉角曙厲蝽以及奧喙蝽)的13個蛋白編碼基因的同義密碼子相對使用度(Relative synonymous codon usage,RSCU),然后利用軟件Heml 1.0.3.7[22]根據RSCU值繪制熱圖。
1.2.3 蛋白質性質分析 蛋白質的親水性、芳香性以及蛋白質長度等[23]被認為是影響線粒體基因組蛋白編碼基因密碼子偏好性的因素。因此,利用軟件Codon W1.4.2[24]來計算出蠋蝽線粒體基因組蛋白編碼基因的蛋白質性質,并通過SPSS 26.0[25]軟件對ENC值和蛋白質性質之間的相關性分析。
1.2.4 有效密碼子數(Effective number of codons,ENC或Nc) 使用軟件Codon W1.4.2計算益蝽亞科8個物種的13個蛋白編碼基因的ENC值,其值的范圍在20~61,用以反映其蛋白編碼基因中的密碼子使用情況。一般來說,當ENC值為35時,被認為是判斷密碼子偏好性強弱的界限;當ENC<35時,表示該基因具有較強的偏好性;而當ENC>35時,表示該基因具有較弱的偏好性[26]。ENC-plot 繪圖分析是以GC3含量為橫坐標、有效密碼子數(ENC)為縱坐標構建一個散點圖,并在圖中添加一條ENC期望曲線(除突變壓力的影響外,不考慮其他因素)。
其中,位于曲線上方的點表示密碼子偏好是由突變引起的,而位于曲線下方的點表示其受到選擇或其他因素的影響[26]。
1.2.5 奇偶圖分析 奇偶圖是以A3/(A3+T3)為縱坐標、G3/(G3+C3)為橫坐標構建的一個散點圖。該圖的中心點(A=T、G=C)表示其密碼子偏好性完全受到突變的影響,數據點根據中心點來分析該物種的蛋白編碼基因的偏性方向和程度。
1.2.6 中性圖分析 中性圖是以GC3為橫坐標、密碼子第1、2位GC含量平均值(GC12)為縱坐標來構建。如果GC12和GC3間顯著相關,則表明突變壓力主導密碼子偏好性;若GC12和GC3間相關性不顯著,則表明自然選擇在密碼子偏好性形成中影響較大。
1.2.7 系統(tǒng)發(fā)育分析 選取45個物種的線粒體基因組蛋白編碼基因序列構建系統(tǒng)發(fā)育樹,其中選擇角盾蝽和紫麗盾蝽作為外類群,用PartitionFinder v.1.1.1[27]進行模型分區(qū)后,用軟件MrBayes v.3.2.5[28]在具有4個獨立馬爾可夫鏈(MCMC)的GTR+G+I替代模型下運行10 000 000代,并且當平均標準偏差值低于0.01時停止,前25%的樹作為老化被丟棄,其余的樹用于構建50%多數共識樹。
蠋蝽線粒體基因組蛋白編碼基因結構如表2所示。
表2 蠋蝽線粒體基因組蛋白編碼基因結構Tab.2 Protein coding gene structure in mitochondrial genome of Arma custos
由表2可知,蠋蝽線粒體基因組的13個蛋白編碼 基 因 是 以 ATN(ND2、COX2、ATP6、COX3、ND3、ND5、ND4、ND4L、ND6和Cytb)和 TTG(COX1、ATP8和ND1)作為其起始密碼子,該物種大多數的蛋白編碼基因是以TAA作為其終止密碼子的,只有COX1、COX2和ND5基因是以T結尾的。
1.培養(yǎng)良好的用餐行為。一日三餐要有規(guī)律,不規(guī)律的飲食會影響胃部的消化,導致胃黏膜損傷形成胃炎,出現胃痛,也會導致機體能量不足,出現營養(yǎng)不良、低血糖、低血壓等現象。而且“一日之計在于晨”,早餐在一天中尤為重要,人體經過一夜的睡眠,體內的營養(yǎng)已消耗殆盡,血糖濃度處于偏低狀態(tài),不吃或少吃早餐,不能及時充分補充血糖濃度,上午就會出現頭昏心慌、四肢無力、精神不振等癥狀,甚至出現低血糖休克,影響正常工作與學習。同時,晚餐也不宜太晚,且不宜過分油膩。
在不受到自然選擇的情況下,突變會影響到其核苷酸組成,由于密碼子的前2位基本保持不變,所以這種影響會反映到密碼子的第3位上。蠋蝽的線粒體總基因組為15 629 bp,核苷酸組成分析結果顯示,A(42.1%)是含量最高的堿基,其次分別是T(33.7%)、C(13.7%)和G(10.5%)。核苷酸使用頻率的趨勢是A>T>C>G(圖1)。通過計算蠋蝽的線粒體基因組總堿基含量及第3位密碼子的堿基含量,得到總GC含量為24.2%,與其他益蝽亞科(藍蝽22.9%,峰疣蝽23.0%,奧喙蝽24.9%,黑益蝽28.3%,益蝽24.69%,黑曙厲蝽24.58%,叉角曙厲蝽24.47%)相差不大。同樣,第3密碼子位置的堿基含量表現出同樣的趨勢,即A3(41.1%)最高,其次依次是T3(34.4%)、C3(13.8%)和G3(10.8%),而這些組成變化也都表明了密碼子的使用偏好。
圖1 蠋蝽線粒體基因組核苷酸組成及其第3密碼子核苷酸組成Fig.1 Nucleotide composition of the mitochondrial genome of Arma custos and the third codon nucleotide composition
在益蝽亞科蛋白編碼基因的62個同義密碼子中(去除2個終止密碼子),不同顏色顯示出在不同蛋白編碼基因之間的顯著差異,表明在不同物種之間不同的蛋白編碼基因間密碼子的使用模式是不同的(圖2)。
圖2 益蝽亞科線粒體基因組13個蛋白編碼基因的62個密碼子RSCU值熱圖Fig.2 Heat map of the RSCU values of 62 codons of 13 protein coding genes in the mitochondrial genome of Asopinae
在益蝽亞科8個物種的13個蛋白編碼基因中,RSCU≥1的密碼子有TTA、ATT和ATA,這些密碼子表現了較高的使用頻率;RSCU<1的密碼子有 CTC、CTG、ATC、ATG、TCG、CCG、ACG 與AGC,表現出了較低的使用頻率。這些結果反映了益蝽亞科線粒體蛋白編碼基因的密碼子使用更偏向于以A/T結尾的密碼子。
通過對蠋蝽13個蛋白編碼基因的蛋白質疏水性和芳香性進行分析,結果如表3所示。
表3 蠋蝽線粒體基因組13個蛋白編碼基因的蛋白質性質Tab.3 Protein properties of 13 protein coding genes in mitochondrial genome of Arma custos
從表3可以看出,蠋蝽的ND4L相較于其他的基因,蛋白質的疏水性最高為1.42,則其親水性最低;而COX2的疏水性最低為0.33,則其親水性最高。同時,蠋蝽COX2的芳香性相較于其他基因最低。通過分析ENC與Gravy(蛋白質的疏水性)之間的相關性,發(fā)現二者之間存在較低的相關性(r=0.421),表明蛋白質的性質會影響蠋蝽線粒體基因組蛋白編碼基因密碼子偏好性,但是影響比較小。
蠋蝽蛋白編碼基因的ENC值的范圍在29.51~37.45,其平均值為33.60,表明其具有較強的密碼子偏好性;而黑益蝽的蛋白編碼基因ENC值的范圍在34.43~47.45,其平均值為40.03,普遍高于其他的益蝽亞科,表明其具有較弱的密碼子偏好性;以及藍蝽與叉角曙厲蝽ATP8基因的ENC值為61,表明其無密碼子偏好性,這可能與其進化速率快、序列較短有關(圖3)。
圖3 益蝽亞科13個蛋白編碼基因的ENC值Fig.3 ENC values of 13 protein-coding genes of Asopinae
根據標準曲線能夠確定影響密碼子偏好性的主要因素,若點位于標準曲線上方,則表示該點所對應蛋白編碼基因的密碼子偏好性不受自然選擇的影響,結果顯示,蠋蝽的ND4L基因、黑益蝽和藍蝽的ND3基因以及峰疣蝽的ND2、Cytb與ND5基因位于標準曲線上方,其他大多數的蛋白編碼基因位于曲線的下方(圖4),結果表明,蠋蝽和其他7個物種具有相似的密碼子使用方式,其線粒體基因組密碼子偏好性主要受自然選擇的影響。
圖4 ENC繪圖分析Fig.4 Plotting analysis of the ENC
評估A/T和G/C對偏好的方向可以提供更多關于偏離中性突變力量的詳細信息,通常使用奇偶圖來測量昆蟲蛋白編碼基因中的這些偏差,結果顯示,蠋蝽的8個蛋白編碼基因集中于第1象限(A3>T3,C3>G3),3個蛋白編碼基因(ND1、ND4和ND5)位于第 4象限(T3>A3,G3>C3),還有 2個基因ATP8和ND4L近似處于同一條直線上(圖5-A),并且蠋蝽的線粒體基因組密碼子使用模式與其他7種益蝽亞科昆蟲的密碼子使用模式高度一致(集中位于第1象限與第四象限)(圖5-B)。表明益蝽亞科蛋白編碼基因密碼子的第3位使用具有偏好性,A/T和G/C之間的平衡在益蝽亞科中受到了干擾,說明其密碼子的使用模式不僅受到突變的影響,還受到自然選擇壓力的影響。
圖5 奇偶圖繪圖分析Fig.5 Plotting analysis of the parity plot
研究蠋蝽、峰疣蝽、奧喙蝽、黑益蝽、藍蝽、益蝽、叉角曙厲蝽和黑曙厲蝽線粒體基因組13個蛋白編碼基因的GC12與GC3含量,除藍蝽、叉角曙厲蝽和黑曙厲蝽外,其他物種的GC12與GC3含量均呈正相關,但以上8個物種均呈現出較低的顯著性(R2<0.25)(圖6)。所有的點呈現不均勻分布,表明自然選擇和突變壓力同時作用于蛋白編碼基因,而密碼子偏好的形成主要是受到自然選擇作用的影響。
圖6 中性圖繪圖分析Fig.6 Analysis of the neutrality plot
比較線粒體基因組序列可以揭示物種之間的系統(tǒng)進化關系,同時闡明昆蟲的進化模式。為深入了解蠋蝽在蝽科的進化規(guī)律和關系,本研究選取了8種天敵昆蟲與蝽亞科35種植食性昆蟲作為內群,選取角盾蝽和紫麗盾蝽作為外群,利用線粒體基因組13個蛋白編碼基因序列來共同構建系統(tǒng)進化樹。基于貝葉斯方法的系統(tǒng)發(fā)育樹具有較高的自舉值,說明其結果較為可靠。結果顯示(圖7),基于13個蛋白編碼基因構建的系統(tǒng)進化樹中蝽亞科與益蝽亞科的單系性都能得到很好的聚類。在系統(tǒng)發(fā)育樹中,蠋蝽與藍蝽關系較近,二者互為姐妹群。另外,基于蛋白編碼基因構建的蝽科系統(tǒng)發(fā)育樹的拓撲結構和基于形態(tài)研究的結果類似,也可證明蛋白編碼基因在物種的系統(tǒng)進化關系中具有和形態(tài)特征同樣的重要性。
圖7 蝽科的線粒體基因組進化樹分析Fig.7 Phylogenetic tree analysis of mitochondrial genome of Pentatomidae
蛋白編碼基因在生物體中具有比較重要的功能,本研究從微觀的角度來探究蠋蝽蛋白編碼基因的變化,從而為其分子水平的進化提供一定的理論依據。蠋蝽線粒體基因組核苷酸組成呈現出很強的AT偏向性,這與桑麗琴[29]研究的昆蟲線粒體基因組和趙婉清等[30]研究的菜蝽結果一致。另一方面,RSCU值顯示了益蝽亞科在不同蛋白編碼基因之間的顯著差異,并表明蛋白編碼基因更偏好以A/T結尾的密碼子。有效密碼子數(ENC)表明,益蝽亞科(除黑益蝽外)具有較強的密碼子偏好性。分析密碼子偏好性的演化指數(ENC繪圖、奇偶圖和中性圖)得到自然選擇是影響密碼子偏好性的主要作用。本研究利用線粒體基因組蛋白質編碼基因構建蝽科系統(tǒng)發(fā)育樹的拓撲結構與以往形態(tài)學[31]和分子分類[32]的研究結果一致,與蠋蝽親緣關系較近的是藍蝽,親緣關系較遠的是黑益蝽。先前的研究表明,密碼子的使用偏好性較強可以促進轉錄和翻譯過程的效率[33-35]。蠋蝽比黑益蝽具有較強的密碼子偏好性,推測其可能比黑益蝽經歷了更多的適應過程和線粒體基因表達的快速變化,從而增加了線粒體代謝過程的能力,有助于它們捕食能力的提高。然而,還有另一種解釋(基于不同累積突變量)也是合理的。正如,前面所提到的GUAN等[17]對蜻蜓目線粒體基因組的研究得到,行動力較強的蜻蜓可以迅速去除有害的非同義替換,保留同義替換,定向突變導致某些類型密碼子的使用更加頻繁。因此,需要對益蝽亞科昆蟲的轉錄和翻譯機制進一步研究,這將闡明密碼子使用和它們的各種生物學效應之間的關系。
密碼子使用偏性是物種在進化過程中適應生長環(huán)境而逐漸形成的,通過對密碼子的使用情況進行分析有助于研究不同物種的進化和環(huán)境適應性。然而,一個基因的密碼子使用的偏好性取決于進化壓力。構建密碼子進化壓力在于突變壓力和自然選擇壓力[36]。不同物種或者同一物種的不同基因之間的密碼子使用情況可能不同,雙翅目偏好使用G/C結尾,而膜翅目偏好A/T結尾。以上結果表明,這些基因組以及基因進化過程中承受的壓力不同。本研究首次探討了蠋蝽及其他益蝽亞科物種的密碼子使用模式,并驗證了自然選擇是影響蠋蝽密碼子偏好性的主要作用。同時證明了親緣關系越近的物種其密碼子的使用模式相似度越高,這與張文娟[37]的研究結果一致。然而,由于蛋白編碼基因ATP8的進化速率快且序列短的緣故,或許并不適用于密碼子偏好性的分析。密碼子優(yōu)化是實現蛋白異源高效表達的重要策略,根據其最優(yōu)密碼子進行密碼子優(yōu)化,可提高蛋白表達水平[38]。但在昆蟲線粒體基因組中最適密碼子優(yōu)化尚未見報道,受此限制,密碼子偏好模式分析會受到影響,無法探討其最優(yōu)密碼子。