陳大嵩,戴建青,韓詩疇
小菜蛾傳染性軟腐病病毒的全基因組序列及其進化分析
陳大嵩,戴建青*,韓詩疇
(廣東省生物資源應(yīng)用研究所,廣東省動物保護與資源利用重點實驗室,廣東省野生動物保護與利用公共實驗室,廣州 510260)
傳染性軟腐病病毒(Iflavirus)屬于小核糖核酸病毒目,是一類單股正鏈RNA病毒,其家族成員正在不斷擴大。Iflavirus的寄主包括鱗翅目、膜翅目和半翅目的昆蟲以及瓦螨,因其對一些重要的農(nóng)業(yè)害蟲產(chǎn)生致病性,因此是重要的潛在生防病毒種類之一。本研究利用小菜蛾轉(zhuǎn)錄組測序數(shù)據(jù)拼接出一條Iflavirus病毒基因組序列。通過查找ORF和序列相似性比對發(fā)現(xiàn)此基因組可編碼一條完整的病毒多聚蛋白并與其他Iflavirus病毒同源,因此將這一新病毒命名為小菜蛾傳染性軟腐病病毒(Diamondback moth iflavirus),英文簡稱DBMIV。通過多聚蛋白序列與RNA聚合酶序列構(gòu)建的進化樹表明DBMIV與PNV、EOPLV和SEIV2進化關(guān)系最近。最后,利用RT-PCR擴增出DBMIV的外殼蛋白區(qū)域驗證了新命名病毒在田間小菜蛾種群的感染。DBMIV的鑒定與命名為利用高通量測序數(shù)據(jù)鑒定病毒新種提供參考,為利用病毒生防重要蔬菜害蟲小菜蛾提供研究思路。
小菜蛾;傳染性軟腐病病毒;基因組;系統(tǒng)進化
病毒存在于自然界的各個角落,幾乎感染任何物種(Dinsdaleetal.,2008)。以昆蟲為寄主的RNA病毒種類包括傳染性軟腐病病毒科Iflaviridae、雙順反子病毒科Dicistroviridae、諾達病毒科Nodaviridae以及質(zhì)型多角體病毒屬(Reoviridae:Cypovirus)(Asgari & Johnson,2010)。相對于其他昆蟲RNA病毒,傳染性軟腐病病毒和雙順反子病毒的寄主包括蜜蜂、家蠶以及農(nóng)業(yè)害蟲等重要昆蟲,所以被研究的更加廣泛。傳染性軟腐病病毒與雙順反子病毒同屬于小核糖核酸病毒目(Picornavirales)。截至目前為止(2017年1月),已經(jīng)報道了幾十種傳染性軟腐病病毒種類,共29條病毒基因組序列(表1),寄主包括鱗翅目Lepidoptera、膜翅目Hymenoptera和半翅目Hemiptera的多種昆蟲以及瓦螨Varroadestructor等節(jié)肢動物,是最重要的昆蟲RNA病毒種類之一。
傳染性軟腐病病毒起初在蜜蜂(Baileyetal.,1964)、家蠶(Kawaseetal.,1980)等經(jīng)濟昆蟲中被分離并鑒定出來,其病毒顆粒是與其他小核糖核酸病毒類似的正二十面體(van Oers,2010),其基因組是單股正鏈RNA(Baileyetal.,1964),基因組RNA的3端具有多聚腺苷酸(Poly(A))結(jié)構(gòu)(Ongusetal.,2004)。除去Poly(A)結(jié)構(gòu),基因組長度大約在9000-10000 bp(表1)。傳染性軟腐病病毒基因組包含一個長ORF,編碼一條多聚蛋白質(zhì),如同其他小核糖核酸病毒一樣沒有亞基因組(Wuetal.,2002)。多聚蛋白由N端到C端為前導(dǎo)肽(Leader peptide)、4個外殼蛋白、解旋酶、蛋白酶和RNA聚合酶。多聚蛋白被翻譯后會被蛋白酶分裂成成熟的、具備各自相應(yīng)功能的蛋白質(zhì)。傳染性軟腐病病毒與雙順反子病毒同屬于小核糖核酸病毒種類,但他們的基因組相差很大。雙順反子病毒擁有兩個ORF,ORF之間有一個基因間隔區(qū)且行使內(nèi)部核糖體進入位點(Internal ribosome entry site,IRES)的功能,靠近5端的ORF編碼結(jié)構(gòu)蛋白而靠近3端的編碼非結(jié)構(gòu)蛋白,而傳染性軟腐病病毒只有一個ORF;傳染性軟腐病病毒ORF的5端能夠編碼前導(dǎo)肽,而雙順反子病毒沒有編碼前導(dǎo)肽。真核生物進行蛋白翻譯時,核糖體需要識別mRNA的5端帽子(cap)結(jié)構(gòu)(Pestovaetal.,2001),而傳染性軟腐病病毒與雙順反子病毒RNA的5端沒有帽子結(jié)構(gòu),但其5端非編碼區(qū)(5′UTR)都存在內(nèi)部核糖體進入位點,允許病毒RNA在5端沒有帽子結(jié)構(gòu)的情況下招募核糖體并翻譯多聚蛋白(Doudna & Sarnow,2007)。
傳染性軟腐病病毒可引起寄主腹瀉、發(fā)育畸形以及致死等多種病癥。例如囊仔病(Sacbrood)能夠引起幼蜂外殼下液體的積聚形成液囊,最終引起幼蜂的死亡(Baileyetal.,1964)。殘翅病毒(Deformed wing virus)是另一種感染蜜蜂的病毒,其能夠引起翅的發(fā)育畸形并導(dǎo)致蜜蜂的致殘(Yue & Genersch,2005)。與殘翅病毒遺傳進化關(guān)系密切的kakugo病毒則能夠入侵蜜蜂的腦組織,引起蜜蜂攻擊性的增強(Fujiyukietal.,2004)。家蠶傳染性軟化病毒(Infectious flacherie virus)則能夠感染家蠶中腸上皮組織并引起病變,進而引起細菌的二次感染,斃死后尸體軟化腐爛(Ayuzawa,1972)。雖然許多傳染性軟腐病病毒對寄主致病,但是另一些的感染卻是無癥狀的,如褐飛虱蜜露病毒雖然能夠在褐飛虱個體間傳染,卻未觀察到明顯病癥(Murakamietal.,2013a;Murakamietal.,2013b)。
隨著高通量測序技術(shù)的發(fā)展,推進了測序技術(shù)在生物學(xué)問題中的應(yīng)用,雖然其在昆蟲病毒的研究中才剛剛起步,但是卻能夠挖掘出豐富的病毒種類(Shietal.,2016)。隨著越來越多的病毒種類被高通量測序所鑒定出來,其數(shù)量遠遠大于傳統(tǒng)的分離鑒定方法,因此一些學(xué)者也提出來制定合適的數(shù)據(jù)質(zhì)控流程,把高通量測序所鑒定出來的病毒種類編入國際病毒分類學(xué)委員會(International Committee on Taxonomy of Viruses,ICTV)的病毒命名名單中(Simmondsetal.,2017)。在本文中,作者通過拼接小菜蛾轉(zhuǎn)錄組測序數(shù)據(jù),獲得一條具有完整的病毒基因組特征的序列。鑒于其可能來自于未命名的病毒種類,作者將其命名為小菜蛾傳染性軟腐病病毒(Diamondback moth iflavirus)。對小菜蛾傳染性軟腐病病毒的命名以及其序列的分析,將為利用高通量數(shù)據(jù)鑒定昆蟲病毒以及其他動物病毒新種提供參考,并且豐富了傳染性軟腐病病毒家族的病毒種類,為生物防控小菜蛾在經(jīng)濟作物中的種群數(shù)量提供新思路。
1.1 DBMIV病毒基因組的序列分析
本實驗室所獲得的小菜蛾轉(zhuǎn)錄組原始序列經(jīng)過過濾后,利用Trinity軟件拼接出小菜蛾傳染性軟腐病病毒(Diamondback moth iflavirus,DBMIV)的基因組序列(Haasetal.,2013)。ORF開放閱讀框利用在線分析工具ORF finder(www.ncbi.nlm.nih.gov/orffinder)查詢,遺傳密碼子選擇通用密碼子(Standard),并查找只以“ATG”起始的閱讀框。利用MEGA7軟件分析核酸組成、氨基酸組成以及同義密碼子頻率(Kumaretal.,2016)。利用Blastn進行核酸序列與NT數(shù)據(jù)庫的序列相似性比對,利用Blastx進行多聚蛋白與NR數(shù)據(jù)庫的序列相似性比對(Camachoetal.,2009)。
1.2 軟腐病病毒系統(tǒng)發(fā)育關(guān)系的重建
傳染性軟腐病病毒科與雙順反子病毒科的氨基酸序列從GenBank獲得,其GenBank登錄號見表1。利用傳染性軟腐病病毒科的多聚蛋白序列在MEGA軟件上以Muscle算法進行多序列比對,比對參數(shù)選擇默認值,最終序列矩陣為4623 aa。利用傳染性軟腐病病毒科的多聚蛋白與雙順反子病毒科的第一段含有非結(jié)構(gòu)蛋白的ORF以Muscle算法進行多序列比對,比對參數(shù)選擇默認值,截取總長1979 aa的RNA聚合酶基因序列矩陣進行序列進化分析。為了確定DBMIV為病毒新種,利用MEGA軟件以p-distance為模型計算傳染性軟腐病病毒科多聚蛋白序列之間的遺傳距離,自展(Bootstrap)1000次計算標準差。利用MEGA軟件計算最大似然法替代模型,根據(jù)貝葉斯信息評判標準(Bayesian Information Criterion,BIC)選擇出最優(yōu)替代模型為LG+G+I+F(次優(yōu)替代模型為LG+G+I)。利用PhyML 3.1軟件構(gòu)建最大似然法進化樹(Guindonetal.,2010),進化模型選擇LG,Proportion of invariable sites 選擇estimated (+I),Gamma distribution parameter 選擇estimated (+G),Amino acid frequencies選擇empirical(+F),置信值利用aLRT算法計算(Anisimova & Gascuel,2006)。生成的進化樹文件用MEGA軟件修改并輸出圖片。利用MrBayes 3.2.5軟件構(gòu)建貝葉斯進化樹(Ronquistetal.,2012),氨基酸模型選擇LG,取樣頻率為10,每100代計算一次分裂頻率平均標準差,共計算106代后檢查標準差的大小并利用Tracer 1.6軟件(tree.bio.ed.ac.uk/software/tracer/)對馬爾科夫鏈的蒙特卡洛循環(huán)(MCMC)進行分析與檢驗,如計算不充足則繼續(xù)追加計算代數(shù),最后舍棄前25%的老化樣本構(gòu)建進化樹與計算后驗概率。利用TreeGraph 2(St?ver & Müller,2010)導(dǎo)出含有后驗概率的Newick進化樹文件利用MEGA軟件修改并輸出圖片,最后利用Adobe Illustrator軟件更換后驗概率數(shù)值的格式。
表 1 傳染性軟腐病與雙順反子病毒科種類的統(tǒng)計Table 1 The summary of the Iflaviridae and Dicistroviridae virus species
續(xù)上表
病毒名Name簡稱Abbreviation登錄號Accession5'UTRORF3'UTRInfectiousflacherievirusIFVACH57393.11559258252KakugovirusKaVBAD06930.111568682314LaJollavirusLJVYP_9140562.160691746Laodelphaxstriatellahoneydewvirus1LSHV1AHK05791.112619378290Lyguslineolarisvirus1LLV1AEL30247.1603896191Lymantriadispariflavirus1LDIV1AIF75200.19368943165MokuvirusMoVAOT85373.16189153285Nilaparvatalugenshoneydewvirus1NLHV1BAN19725.111369528303Nilaparvatalugenshoneydewvirus2NLHV2BAN57352.19889738259Nilaparvatalugenshoneydewvirus3NLHV3BAN57353.17839528289OpsiphanesinviraeiflavirusOIIV1AKN81079.1254955843PerinanudavirusPNVAAL06289.1473896142SacbroodvirusSaVAAD20260.1178857777SlowbeeparalysisvirusSBPVABS84820.13168895294Spodopteraexiguaiflavirus1SEIV1AET36829.13449669334Spodopteraexiguaiflavirus2SEIV2AFQ98017.1391903377ThaumetopoeapityocampaiflavirusTPIVAJC98140.17598874183Varroadestructorvirus1VDV1AAP51418.211178682313雙順反子病毒科(Dicistroviridae)病毒名Name簡稱Abbreviation登錄號Accession屬GenusAcutebeeparalysisvirusABPVAAG13118.1AparavirusIsraeliacuteparalysisvirusIAPVAAV64179.2AparavirusKashmirbeevirusKBVAAP32283.1AparavirusSolenopsisinvictavirus-1SIV1AAU85375.1AparavirusTaurasyndromevirusTSVAAK72220.1AparavirusAnophelesCvirusACVALS55295.1CripavirusAphidlethalparalysisvirusALPVAAN61470.1CripavirusCricketparalysisvirusCPVAAF80998.1CripavirusDrosophilaCvirusDCVAAC58807.1CripavirusEmpeyratvirusEmVAMO03208.1CripavirusNilaparvatalugensCvirusNLCVAIY53985.1CripavirusRhopalosiphumpadivirusRhPVAAC95509.1CripavirusBlackqueencellvirusBQCVAAF72337.1TriatovirusHimetobiPvirusHiPVBAA32553.1TriatovirusHomalodiscacoagulatavirus-1HCV1ABC55703.1TriatovirusPlautiastaliintestinevirusPAIVBAA21898.1TriatovirusTriatomavirusTrVAAF00472.1Triatovirus
注:5′UTR:5端非編碼區(qū);ORF:蛋白開放閱讀框;3′UTR:3端非編碼區(qū)。Note: 5′UTR: 5′ untranslated region; ORF: open reading frame; 3′UTR: 3′ untranslated region.
1.3 RT-PCR的引物設(shè)計與實驗過程
小菜蛾成蟲于2017年3月采集于廣州市廟貝村(113.4°E,22.8°N),利用RNAiso Plus(TaKaRa)按照實驗說明提取總RNA后 ,利用逆轉(zhuǎn)錄試劑盒TransScript First-Strand cDNA Synthesis SuperMix(全式金)合成cDNA。利用Oligo 7設(shè)計兩對DBMIV的RT-PCR擴增引物(DBMIV1和DBMIV2),引物序列為DBMIV1F:5′-CCT GCA CCC GAC ATT TGA ACC-3′,DBMIV1R:5′-AGC TAC CGT CAT AAG CAT ATA GTT CG-3′;DBMIV2F:5′-CGA ACC GCT ATT CAG TGT ATT CTT AGC A-3′,DBMIV2R:5′-ATC AAA CGC ATT GTT GAG GAC-3′,PCR產(chǎn)物長度分別為1035 bp與1150 bp。PCR體系根據(jù)EasyTaq DNA Polymerase(全式金)實驗說明按比例混合成20 μL后,在PCR擴增儀中運行如下程序:94℃預(yù)變性2 min,擴增循環(huán)為94℃變性30s,55℃退火30s,72℃延伸90s,運行35個擴增循環(huán)后 72℃延伸7 min。PCR產(chǎn)物加入1%濃度瓊脂糖凝膠中,在5 V/cm電壓下電泳30 min以檢測PCR結(jié)果,陽性結(jié)果用于直接測序。
2.1 DBMIV病毒的發(fā)現(xiàn)與命名
拼接本實驗室所獲得小菜蛾轉(zhuǎn)錄組數(shù)據(jù)獲得一條9580 bp長的序列,利用Blast方法與NCBI的NT數(shù)據(jù)庫比對發(fā)現(xiàn)其與一種類小核糖核酸病毒(picorna-like virus)——榕透翅毒蛾病毒(Perina nuda virus,PNV)的基因組序列十分相近,Blastn結(jié)果總評分(Total score)為4888 bit,期望值(E value)為0。利用ORF finder查找序列的ORF讀碼框發(fā)現(xiàn)其ORF長9039 bp,可編碼一段完整的3012 aa的長肽,5′UTR與3′UTR分別長486 bp和55 bp(圖1)。利用Blastp把ORF編碼的氨基酸序列與NR數(shù)據(jù)庫做比對,與茶尺蠖類小核糖核酸病毒(Ectropis obliqua picorna-like virus,EOPLV)相似度最高,其次為榕透翅毒蛾病毒,相似區(qū)域均占序列總長度(Query cover)的95%。Blastp結(jié)果Total score分別為4751 bit與4747 bit,E值均為0,相同的氨基酸位點(Identities)分別為2282和2278,分別占序列比對區(qū)域總長的78%和79%,序列比對間隙(Gaps)分別為59和50,分別占序列比對區(qū)域總長的2%和1%。氨基酸序列同源序列保守域(Putative conserved domains)包括小核糖核酸病毒衣殼蛋白(Picornavirus capsid protein)、RNA解旋酶(RNA helicase)以及RNA依賴的RNA聚合酶(RNA-dependent RNA polymerase,RdRp)(圖2)。鑒于其完整的病毒序列特征,且與傳染性軟腐病病毒屬(Iflavirus)關(guān)系相近,其可能是未命名的新病毒,按照病毒命名習(xí)慣對其以寄主名加病毒屬名的方式命名為小菜蛾傳染性軟腐病病毒,英文名為Diamondback moth iflavirus,英文縮寫為DBMIV。其基因組序列信息提交GenBank保存,登錄號(GenBank accession number)為KY435608。
圖 1 DBMIV基因組的結(jié)構(gòu)Fig.1 Schematic diagram of the genome organization of DBMIV注:方框代表ORF閱讀框,所在堿基位置用數(shù)字標記。結(jié)構(gòu)蛋白(外殼蛋白1-4)和非結(jié)構(gòu)性蛋白(解旋酶、蛋白酶以及RNA聚合酶)的大致位置標記在ORF框內(nèi),帶括號的L代表前導(dǎo)肽,實心圓代表基因組5′端可能連接的病毒基因組結(jié)合蛋白(VPg)。Note: The ORF corresponds to the entire open box and the numbers indicate nucleotide positions.The approximate positions of the structural proteins (coat protein 1-4) and nonstructural proteins (helicase, protease and RNA-dependent RNA polymerase, RdRp) are shown in the box.Protein L with parentheses denotes a probable leader peptide.A solid circle represents the genome-linked viral protein (VPg) protein (if presents) that links at the 5′ end of genome.
CP1:
Helicase:
RdRp:
圖 2 傳染性軟腐病病毒蛋白序列的比對。Fig.2 The multiple alignments of the amino acid sequences between the iflaviruses
2.2 DBMIV基因組的特征
DBMIV基因組5端非轉(zhuǎn)錄區(qū)的GC含量為38%,低于ORF區(qū)(46%)以及3端非轉(zhuǎn)錄區(qū)(44%)(圖3上)。ORF區(qū)與3端非轉(zhuǎn)錄區(qū)GC偏倚不同,ORF區(qū)GC偏倚為正(G多于C),而3端非轉(zhuǎn)錄區(qū)GC偏倚為負。密碼子的不同位點,受選擇壓力不同,可能出現(xiàn)不同的核酸組成。ORF區(qū)第一位密碼子GC含量(51%)明顯高于第二位(42%)和第三位(46%)(圖3下)。第二位與第三位密碼子的主要差別為GC偏倚和AU偏倚不同。總體來說, GC含量的變化主要因為U和G的含量變化造成的。
DBMIV基因組使用最多的幾個氨基酸為亮氨酸(L:8.1%)、甘氨酸(G:7.57%)、纈氨酸(V:7.1%)、丙氨酸(A:7.01%)、絲氨酸(S:6.61%)和蘇氨酸(T:6.47%),而相對較少出現(xiàn)的氨基酸為組氨酸(H:2.32%)、甲硫氨酸(M:2.29%)、半胱氨酸(C:1.93%)和色氨酸(W:1.43%),但是總體來說并沒有極端的使用偏好(圖4)。DBMIV基因組使用UAA為終止子,GAU(101)、GAG(98)、AAG(91)、UUU(87)、AAC(76)和AUA(72)為使用最多的密碼子,而密碼子CGC(19)、CCG(18)、CGU(18)、AGC(15)和CGG(12)使用較少(表2)。
圖 3 DBMIV基因組核酸比例分布圖Fig.3 Nucleotide frequencies of the DBMIV genome注:由左至右、由上到下分別代表5端非轉(zhuǎn)錄區(qū)、ORF開放閱讀框、3端非轉(zhuǎn)錄區(qū)、ORF的第1-3個堿基位點的核酸比例。Note: The nucleotide frequencies of 5′UTR, ORF, 3′UTR, the first, the second and the third nucleotide of the ORF were displayed from left to right and from top to bottom.
圖 4 DBMIV基因組氨基酸頻率分布圖Fig.4 Amino acid frequencies of the DBMIV genome 注:橫坐標代表氨基酸種類,縱坐標代表某個氨基酸的百分比。Note: Amino acids were shown on horizontal axis and the percentages of the amino acid frequencies were displayed as vertical axis.
表 2 DBMIV基因組同義密碼子頻率表Table 2 Relative synonymous codon usage of the DBMIV genome
注:密碼子后的括弧代表氨基酸種類,密碼子數(shù)量后的括弧代表同義密碼子頻率。Note: Codons were following up with the amino acids in parentheses.Following the codon frequencies were relative synonymous codon usage given in parentheses.
2.3 DBMIV的系統(tǒng)發(fā)育分析
為了確認DBMIV確實為新的病毒,把DBMIV多聚蛋白的氨基酸序列與Iflavirus屬的病毒物種的多聚蛋白做比較。多序列比對后,兩兩比較遺傳距離,最終匯總成表3。DBMIV與大多數(shù)傳染性軟腐病病毒遺傳距離都較遠,但與PNV和EOPLV遺傳距離相近,其遺傳距離分別為0.2345±0.0069和0.2370±0.0066。PNV和EOPLV之間的遺傳距離為0.1272±0.0058。為了確定DBMIV在Iflavirus屬的進化關(guān)系,利用Iflavirus屬的多聚蛋白序列構(gòu)建的最大似然(ML)樹以及貝葉斯推論(BI)樹(圖5)。兩種構(gòu)建進化樹的方法所重構(gòu)的拓撲結(jié)構(gòu)類似,且大部分的置信值與后驗概率很高。但是BBPLV在ML樹中形成獨立的分支,但置信值很低,在BI樹中與DCPV形成姊妹群,后驗概率較高(0.95)。DBMIV和PNV、EOPLV、SEIV2形成一個分支且置信值和后驗概率都很高。為了確定DBMIV在Iflavirus屬的進化地位,利用雙順反子病毒科(Dicistroviridae)作為外群(圖6),通過病毒常用的RNA聚合酶基因進行多序列比對后構(gòu)建ML樹和BI樹,重構(gòu)的拓撲結(jié)構(gòu)十分類似,且BBPLV和DCPV形成姊妹群,雖然在ML樹中置信值為88,在BI樹中后驗概率為0.98。通過加入外群后發(fā)現(xiàn)DBMIV、PNV、EOPLV和SEIV2形成的分支首先與其他Iflavirus屬的病毒分開。
2.4 DBMIV病毒的RT-PCR驗證
利用DBMIV基因組序列設(shè)計出兩對RT-PCR引物DBMIV1和DBMIV2用于擴增DBMIV的CP蛋白區(qū)域。對田間采集的小菜蛾樣品進行檢測后發(fā)現(xiàn)兩個樣品能夠獲得陽性條帶。見圖7所示引物DBMIV1和DBMIV2均能獲得大于1kb的電泳條帶,1號樣品條帶很亮且測序結(jié)果也得到證實,但2號樣品的檢測條帶亮度很弱,也無法得到測序結(jié)果,這可能因為DBMIV的滴度在田間某些成蟲體內(nèi)很低有關(guān)。另外值得注意的是并非所有樣品都擴增出RT-PCR的條帶,這說明小菜蛾田間種群的DBMIV感染率并非100%。
圖5 基于多聚蛋白序列構(gòu)建最大似然法(左)和貝葉斯法(右)進化樹Fig.5 Phylogenetic ML (left) and Bayesian (right) tree based on the amino acid sequences of the polyproteins of Iflaviridae
圖 6 基于RNA聚合酶蛋白序列構(gòu)建的最大似然法(左)和貝葉斯法(右)進化樹Fig.6 Phylogenetic ML (left) and Bayesian (right) tree based on the amino acid sequences of the RdRp proteins with the outgroup of Dicistroviridae
病毒廣泛分布(Dinsdaleetal.,2008;López-Buenoetal.,2009),幾乎能感染任何的物種,且在生態(tài)系統(tǒng)中扮演重要的角色(Handleyetal.,2012;Ignacio-Espinozaetal.,2013;Xuetal.,2015),甚至在無脊椎動物的轉(zhuǎn)錄組序列中也常常能夠發(fā)現(xiàn)新的病毒物種(Shietal.,2016)。本文報道的是在實驗室拼接測序的小菜蛾轉(zhuǎn)錄組序列時,獲得一條長9580 bp的病毒基因組序列,ORF預(yù)測其可編碼一條完整的蛋白質(zhì)且包含病毒衣殼蛋白、RNA酶和解旋酶等序列保守域,其序列特征十分類似傳染性軟腐病病毒,因此將其命名為小菜蛾傳染性軟腐病病毒,英文簡稱DBMIV。隨著高通量測序成本的逐年下降以及更多的高通量測序的完成,利用高通量測序?qū)l(fā)現(xiàn)并命名更多的病毒種類,如三種褐飛虱蜜露病毒都是利用RNA測序數(shù)據(jù)拼接而成的(Murakamietal.,2013a;Murakamietal.,2013b)。
核酸的GC含量影響著核酸的穩(wěn)定性、變異速率以及二級結(jié)構(gòu)等。DBMIV的5′UTR其GC含量比其他區(qū)域低,可能因為5′UTR具有IRES位點,需要折疊成一定的二級結(jié)構(gòu)并招募核糖體(Lietal.,2012;Luetal.,2007;Luetal.,2006;Ongusetal.,2006;Wuetal.,2007)。DBMIV的ORF區(qū)域并沒有嚴重的核酸偏好,其原因為氨基酸使用偏好沒有嚴重的偏倚,且也沒有偏好使用高AT或GC的同義密碼子。
圖 7 DBMIV的RT-PCR檢測電泳圖Fig.7 Electrophoretogram of the RT-PCR detections to DBMIV
將Iflaviridae病毒屬的多聚蛋白遺傳距離進行計算與比較發(fā)現(xiàn),DBMIV與PNV和EOPLV遺傳距離最相近。但是其遺傳距離比PNV和EOPLV之間的遺傳距離大。DWV和KaV普遍被認為是同種病毒的不同亞型,而VDV1被認為是獨立的病毒,DWV和KaV之間的遺傳距離為0.0100±0.0017,VDV1與DWV和KaV之間的遺傳距離為0.0460±0.0038和0.0488±0.0038,都小于DBMIV與PNV和EOPLV的遺傳距離。DBMIV的ORF長9039,與PNV和EOPLV的ORF(8961和8964)相差78和75個氨基酸殘基,相差也較大,因此可以確定DBMIV為新病毒種類。
在構(gòu)建Iflaviridae系統(tǒng)發(fā)育關(guān)系時,用多聚蛋白全序列與用RNA聚合酶序列構(gòu)建的進化樹的拓撲分支結(jié)構(gòu)十分類似,因此RNA聚合酶序列雖然是病毒基因組的部分序列,但卻能夠提供足夠的進化信息,也因此RNA聚合酶序列常常被用來重構(gòu)病毒系統(tǒng)發(fā)生與進化關(guān)系(Ryabov,2007;Shietal.,2016;Wangetal.,2004)。利用多聚蛋白全序列構(gòu)建的ML樹和BI樹時,BBPLV的分支結(jié)構(gòu)不一致,BBPLV所在的ML樹形成獨立分支但分支置信值較低,但是利用多聚蛋白全序列構(gòu)建的BI樹與RNA聚合酶序列構(gòu)建的進化樹分支結(jié)構(gòu)是類似的,因此推測BBPLV與DCPV形成姊妹群,而不是獨立的分支。多聚蛋白全序列構(gòu)建的結(jié)果不一致的原因可能為不同病毒的序列長度差別大,保守結(jié)構(gòu)域不連續(xù),產(chǎn)生的空隙(Gaps)較多,因此容易產(chǎn)生進化雜信號而導(dǎo)致的。RNA聚合酶序列較保守,長度變化不大,且是RNA病毒共有的、功能類似的基因,在重構(gòu)RNA病毒系統(tǒng)發(fā)育上具有天然的優(yōu)勢。
許多傳染性軟腐病病毒能夠引起寄主嚴重的病癥,如造成蠶桑業(yè)嚴重經(jīng)濟損失的家蠶軟化病毒(IFV)感染家蠶中腸上皮細胞,引起軟化腐爛并導(dǎo)致死亡(Ayuzawa,1972)。但也發(fā)現(xiàn)一些傳染性軟腐病病毒種類的感染未發(fā)現(xiàn)明顯癥狀。與小菜蛾軟腐病病毒遺傳進化關(guān)系相近的SEIV2未發(fā)現(xiàn)對寄主甜菜夜蛾致病(Choietal.,2012),EOPLV被報導(dǎo)從顆粒體病毒感染致死的茶尺蠖幼蟲中分離出來的,暗示其與顆粒體病毒協(xié)同對茶尺蠖幼蟲產(chǎn)生致死作用(Wangetal.,2004)。另一種與小菜蛾軟腐病病毒遺傳進化關(guān)系相近的PNV病毒對寄主榕透翅毒蛾產(chǎn)生類黃疸癥狀,并且與榕透翅毒蛾核多角體病毒(Perina nuda nucleopolyhedrosis,PenuNPV)協(xié)同產(chǎn)生軟腐病病癥(Wangetal.,1999)。雖然小菜蛾軟腐病病毒是利用轉(zhuǎn)錄組數(shù)據(jù)偶然被發(fā)現(xiàn)的,但深入研究其對寄主的致病性,或者與其他病毒一起對寄主的協(xié)同致病性等生物學(xué)問題,可為小菜蛾生物防治提供新思路,對開發(fā)小菜蛾病毒性殺蟲劑有重要科學(xué)意義。
References)
Anisimova M,Gascuel O.Approximate likelihood-ratio test for branches: A fast, accurate, and powerful alternative [J].SystematicBiology,2006,55(4):539-552.
Asgari S,Johnson KN.Insect virology [M].Australia:Caister Academic Press,2010.
Ayuzawa C.Studies on the infectious flacherie of the silkworm,BombyxmoriL.:I.Purification of the virus and its some properties [J].JournalofInsectBiotechnologyandSericology,1972,41(5):338-344.
Bailey L,Gibbs AJ,Woods RD.Sacbrood virus of the larval honey bee (ApismelliferaLinnaeus) [J].Virology,1964,23:425-429.
Camacho C,Coulouris G,Avagyan V,etal.BLAST+: architecture and applications [J].BMCBioinformatics,2009,10:421.
Choi JY,Kim YS,Wang Y,etal.Complete genome sequence of a novel picorna-like virus isolated fromSpodopteraexigua[J].JournalofAsia-PacificEntomology,2012,15(2):259-263.
Dinsdale EA,Edwards RA,Hall D,etal.Functional metagenomic profiling of nine biomes [J].Nature,2008,452(7187):629-632.
Doudna JA,Sarnow P.Translational Control in Biology and Medicine.Translation initiation by viral internal ribosome entry sites [M].Cold Spring Harbor Monograph Archive,2007,48:129-153.
Fujiyuki T,Takeuchi H,Ono M,etal.Novel insect picorna-like virus identified in the brains of aggressive worker honeybees [J].JournalofVirology,2004,78(3):1093-1100.
Guindon S,Dufayard JF,Lefort V,etal.New algorithms and methods to estimate maximum-likelihood phylogenies: assessing the performance of PhyML 3.0 [J].SystematicBiology,2010,59(3):307-321.
Haas BJ,Papanicolaou A,Yassour M,etal.Denovotranscript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis [J].NatureProtocols,2013,8(8):1494-1512.
Handley SA,Thackray LB,Zhao G,etal.Pathogenic simian immunodeficiency virus infection is associated with expansion of the enteric virome [J].Cell,2012,151(2):253-266.
Ignacio-Espinoza JC,Solonenko SA,Sullivan MB.The global virome: not as big as we thought? [J].CurrentOpinioninVirology,2013,3(5):566-571.
Kawase S,Hashimoto Y,Nakagaki M.Characterization of flacherie virus of the silkworm,Bombyxmori[J].TheJournalofSericulturalScienceofJapan,1980,49(6):477-484.
Kumar S,Stecher G,Tamura K.MEGA7: Molecular evolutionary genetics analysis version 7.0 for bigger datasets [J].MolecularBiologyandEvolution,2016,33(7):1870-1874.
López-Bueno A,Tamames J,Velázquez D,etal.High diversity of the viral community from an antarctic lake [J].Science,2009,326(5954):858-861.
Li M,Man N,Qiu H,etal.Detection of an internal translation activity in the 5′ region ofBombyxmoriinfectious flacherie virus [J].AppliedMicrobiologyandBiotechnology,2012,95(3):697-705.
Lu J,Hu Y,Hu L,etal.Ectropisobliquapicorna-like virus IRES-driven internal initiation of translation in cell systems derived from different origins [J].JournalofGeneralVirology,2007,88(Pt 10):2834-2838.
Lu J,Zhang J,Wang X,etal.Invitroandinvivoidentification of structural and sequence elements in the 5′ untranslated region ofEctropisobliquapicorna-like virus required for internal initiation [J].JournalofGeneralVirology,2006,87(Pt 12):3667-3677.
Murakami R,Suetsugu Y,Kobayashi T,etal.The genome sequence and transmission of an iflavirus from the brown planthopper,Nilaparvatalugens[J].VirusResearch,2013a,176(1-2):179-187.
Murakami R,Suetsugu Y,Nakashima N.Complete genome sequences of two iflaviruses from the brown planthopper,Nilaparvatalugens[J].ArchivesofVirology,2013b,159(3):585-588.
Ongus JR,Peters D,Bonmatin JM,etal.Complete sequence of a picorna-like virus of the genusIflavirusreplicating in the miteVarroadestructor[J].JournalofGeneralVirology,2004,85(Pt 12):3747-3755.
Ongus JR,Roode EC,Pleij CW,etal.The 5′ non-translated region ofVarroadestructorvirus 1 (genusIflavirus): structure prediction and IRES activity inLymantriadisparcells [J].JournalofGeneralVirology,2006,87(Pt 11):3397-3407.
Pestova TV,Kolupaeva VG,Lomakin IB,etal.Molecular mechanisms of translation initiation in eukaryotes [J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2001,98(13):7029-7036.
Ronquist F,Teslenko M,van der Mark P,etal.MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space [J].SystematicBiology,2012,61(3):539-542.
Ryabov EV.A novel virus isolated from the aphidBrevicorynebrassicaewith similarity to Hymenoptera picorna-like viruses [J].JournalofGeneralVirology,2007,88(Pt 9):2590-2595.
Shi M,Lin XD,Tian JH,etal.Redefining the invertebrate RNA virosphere [J].Nature,2016,540(7634):539-543.
Simmonds P,Adams MJ,Benko M,etal.Consensus statement: Virus taxonomy in the age of metagenomics [J].NatureReviewsMicrobiology,2017,15(3):161-168.
St?ver BC,Müller KF.TreeGraph 2: combining and visualizing evidence from different phylogenetic analyses [J].BMCBioinformatics,2010,11:7.
van Oers MM.Insect virology.Genomics and biology of Iflaviruses [M].Australia:Caister Academic Press,2010,10:231-250.
Wang CH,Wu CY,Lo CF.A new picorna-like virus, PnPV, isolated from ficus transparent wing moth,Perinanuda(Fabricius) [J].JournalofInvertebratePathology,1999,74(1):62-68.
Wang X,Zhang J,Lu J,etal.Sequence analysis and genomic organization of a new insect picorna-like virus,Ectropisobliquapicorna-like virus, isolated fromEctropisobliqua[J].JournalofGeneralVirology,2004,85(Pt 5):1145-1151.
Wu CY,Lo CF,Huang CJ,etal.The complete genome sequence ofPerinanudapicorna-like virus, an insect-infecting RNA virus with a genome organization similar to that of the mammalian picornaviruses [J].Virology,2002,294(2):312-323.
Wu TY,Wu CY,Chen YJ,etal.The 5′ untranslated region ofPerinanudavirus (PnV) possesses a strong internal translation activity in baculovirus-infected insect cells [J].FebsLetters,2007,581(16):3120- 3126.
Xu GJ,Kula T,Xu Q,etal.Comprehensive serological profiling of human populations using a synthetic human virome [J].Science,2015,348(6239):aaa0698.
Yue C,Genersch E.RT-PCR analysis of Deformed wing virus in honeybees (Apismellifera) and mites (Varroadestructor) [J].JournalofGeneralVirology,2005,86(Pt 12):3419-3424.
Phylogenetics analysis of the complete genome of Diamondback moth iflavirus
CHEN Da-Song, DAI Jian-Qing*, HAN Shi-Chou
(Guangdong Key Laboratory of Animal Conservation and Resource Utilization, Guangdong Public Laboratory of Wild Animal Conservation and Utilization, Guangdong Institute of Applied Biological Resources, Guangzhou 510260, China)
The growing number of Iflaviruses are positive strind RNA viruses, which belong to Picornavirales.The hosts of Iflaviruses include Lepidoptera, Hymenoptera, Hemiptera andVarroadestructor.Iflaviruses are pathogenic to some main agricultural pests and are the potential viruses that could be used in biological control.In this study we assembled a complete Iflavirus genome from the transcriptome data of diamond moth.We find an ORF in this genome which can encode a complete polyprotein homologue to other Iflavirus genomes.Therefore, we nominate this new virus as Diamondback moth iflavirus, and the abbreviation is DBMIV.The phylogenetic analysis based on the polyprotein and RNA polymerase sequences showed that the DBMIV was evolutionally closed to PNV, EOPLV and SEIV2.Eventually, DBMIV was verified to infect the DBM in the field by RT-PCR amplification of the coat protein region.The identification of the DBMIV provided a referential scheme of virus species identification from high-through sequencing data, and offered a new research approach of virus control to the diamond moth.
Plutellaxylostella; Iflavirus; genome; phylogenetics
陳大嵩,戴建青,韓詩疇.小菜蛾傳染性軟腐病病毒的全基因組序列及其進化分析[J].環(huán)境昆蟲學(xué)報,2017,39(3):618-631.
國家自然科學(xué)基金(31371932);廣東省科學(xué)院青年科學(xué)研究基金(qnjj201602);廣東省科學(xué)院科技發(fā)展專項(2017GDASCX-0107)
陳大嵩,男,1986年生,博士,主要從事分子生物學(xué)和化學(xué)生態(tài)學(xué)研究,E-mail: chends@giabr.gd.cn
*通訊作者Author for correspondence, E-mail: jqdai@giabr.gd.cn
Received: 2017-02-10;接受日期Accepted: 2017-05-18
Q968.1;S433.4
A
1674-0858(2017)03-0618-14