馬小靜,張巧娥,李繼東
(寧夏大學農學院,寧夏 銀川 750021)
牛病毒性腹瀉病毒(bovine viral diarrhea virus,BVDV)是一種與牛胃腸道、呼吸道和生殖道疾病相關的重要病原體,其所導致的繁殖機能下降給全球養(yǎng)牛業(yè)造成了持續(xù)的經濟損失.妊娠母牛感染BVDV后會出現流產,產出畸形胎兒或木乃伊胎,甚至產出持續(xù)感染牛(PI牛),而PI牛是BVDV最主要的傳染源[1].BVDV是一種有囊膜的單股正鏈線性RNA病毒,屬于黃病毒科瘟病毒屬,其基因組長約 12.5 kb,由5′非翻譯區(qū)(5′untranslated region,5′UTR)、一個大的開放性閱讀框(open reading frame,ORF)和3′非翻譯區(qū)(3′untranslated region,3′UTR)構成.ORF編碼3 988個氨基酸,由細胞和病毒蛋白酶加工后至少生成 12種成熟蛋白質,包括Npro,C,ERNS,E1,E2,p7,NS2,NS3,NS4A,NS4B,NS5A,NS5B[2-3].Npro是一種非結構蛋白,它能夠產生自己的C端.核衣殼蛋白C和3種包膜糖蛋白ERNS、E1、E2代表BVDV的結構蛋白.E2是瘟病毒中高度可變的、具有免疫學優(yōu)勢的糖蛋白,是中和抗體的主要靶標[4].5′-UTR是病毒基因組中高度保守的部分,其包含一個內部核糖體進入位點,與病毒多種蛋白的翻譯有關.
目前,瘟病毒屬包括4種已被國際病毒分類委員會(ICTV)認可批準的病毒:BVDV-1,BVDV-2,經典豬瘟病毒(CSFV)和綿羊邊界病病毒(BDV).此外,Schirrmeier等從巴西源的胎牛血清中分離到Hobi樣病毒,即BVDV-3型[5],在對其進行遺傳學和抗原學分析后,將其歸為黃病毒科瘟病毒屬,之后也陸續(xù)從意大利、巴西等地的自然病例中分離得到.基因組的不同區(qū)域,如5′UTR、Npro、E2、NS2-3和NS5B等已被用于BVDV和其他瘟病毒的基因分型和分類,如構建分子進化樹常用NS5B內的RNA聚合酶(RdRP)基因和5′UTR序列.根據基因組5′UTR的差異,將BVDV分為2種基因型:BVDV-1型和BVDV-2型[6].5′UTR序列最常用于BVDV分離株的系統(tǒng)發(fā)育分析和基因分型,其次是Npro和E2基因序列.迄今為止,幾乎所有BVDV亞基因型都根據這3個基因組區(qū)域進行分類.對BVDV分離株的Npro和E2基因序列進行分析,能夠更可靠的將其分配到已建立的和新鑒定的亞基因型中.自20世紀90年代初期鑒定了2種BVDV-1亞基因型之后,至今已分離到至少22種BVDV-1亞基因型(BVDV1a-1v).依據BVDV-2型5′端非編碼區(qū)存在的二級結構差異性,Giangasper M將其進一步細分為4個亞型,BVDV2a、BVDV2b、BVDV2c和BVDV2d[7].Vilcek關于BVDV基因分型結果表明,亞基因型的分布與病毒分離株的地理來源無關[8].2007年,任敏從新疆等地的病料中首次分離到了BVDV-2型的病毒,這是我國首次報道關于BVDV-2型毒株的分離與鑒定[9].根據體外細胞培養(yǎng)特性,BVDV-1型和BVDV-2型又進一步被細分為細胞致病型(cp)和非細胞致病型(ncp).值得一提的是,ncp BVDV對胎兒先天免疫應答的調節(jié)和建立BVDV持續(xù)感染具有重要意義[10].
密碼子偏好性(condon usage bias,CUB)是指同義密碼子在編碼氨基酸時使用頻率并不完全相同的現象[11].目前,一些參數已被廣泛用于研究密碼子偏好性,包括相對同義密碼子使用度(relative synonymous codon usage,RSCU),密碼子適應指數(codon adaptation index,CAI)以及最優(yōu)密碼子使用頻率(frequency of optimal codons,FOP)等.2010年,Fu等[12]對皰疹病毒的密碼子偏好性進行研究后指出,Tupaiid皰疹病毒Ⅰ型(TuHV-1,Tupaiid herpesvirus 1)的密碼子偏好性和巨細胞病毒相似,且基于氨基酸序列或完整基因組序列的系統(tǒng)發(fā)育分析結果也顯示這2種病毒關系密切.此外,一項針對于羊痘病毒密碼子的研究發(fā)現,系統(tǒng)發(fā)育上彼此接近的病毒,特別是同一屬的成員,在其編碼區(qū)共享相似的核苷酸組成模式并采用幾乎完全相同的最優(yōu)密碼子[13].以上研究發(fā)現都為密碼子偏好性在病原分型中的應用提供了更多的證據.
基于以上研究結果,本研究對數據庫中BVDV基因組序列進行分析,計算密碼子偏好性參數,對所得數據進行對應分析,進一步對分析所得數據進行聚類,聚類結果和BVDV分子進化樹進行比對,探索基于密碼子偏性的病毒分型方法.
本文數據來源于NCBI的核酸數據庫Nucleotide,檢索到2019年1月為止所有BVDV基因組序列和BDV、CFSV基因組參考序列,包括BVDV-1、BVDV-2、BVDV-3共計104條核酸序列.具體信息見表1.
表1 BVDV序列信息
續(xù)表1 Continuedtable1檢索號Accession病毒株Virusstrain國家CountryMH166806BVDV-1/XC中國ChinaMH379638BVDV-1/Ho916英國UKMH490942BVDV-1/BJ-2013中國ChinaMH490943BVDV-1/BJ-2016中國ChinaAB567658BVDV-2/Hokudai-Lab/09日本JapanAB894423BVDV-2/GBK_E+日本JapanAB894424BVDV-2/GBK_E-日本JapanAF002227BVDV-2/C413美國USAAF502399BVDV-2-NewYork'93德國GermanyFJ527854BVDV-2/XJ-04中國ChinaGQ888686BVDV-2/JZ05-1中國ChinaHG426479BVDV-2/D37-13-2_Dup(-)德國GermanyHG426480BVDV-2/D37-13-2_Dup(+)德國GermanyHG426481BVDV-2/D75-13-609_Dup(-)德國GermanyHG426482BVDV-2/D75-13-609_Dup(+)德國GermanyHG426483BVDV-2/NRW12-13_Dup(-)德國GermanyHG426484BVDV-2/NRW12-13_Dup(+)德國GermanyHG426485BVDV-2/NRW14-13_Dup(-)德國GermanyHG426486BVDV-2/NRW14-13_Dup(+)德國GermanyHG426487BVDV-2/NRW19-13-1_Dup(-)德國GermanyHG426488BVDV-2/NRW19-13-1_Dup(+)德國GermanyHG426489BVDV-2/NRW19-13-8_Dup(-)德國GermanyHG426490BVDV-2/NRW19-13-8_Dup(+)德國GermanyHG426491BVDV-2/Potsdam1600德國GermanyHG426492BVDV-2/SH2210-14德國GermanyHG426493BVDV-2/SH2210-17德國GermanyHG426494BVDV-2/SH2210-23德國GermanyHG426495BVDV-2/VOE4407德國GermanyHQ258810BVDV-2/SH-28中國ChinaJF714967BVDV-2/HLJ-10中國ChinaKC963968BVDV-2/11F011韓國KoreaKJ000672BVDV-2/SD1301中國ChinaKT832817BVDV-2/USMARC-60764美國USAKT832818BVDV-2/USMARC-60765美國USAKT832819BVDV-2/USMARC-60766美國USAKT832820BVDV-2/USMARC-60767美國USAKT832821BVDV-2/USMARC-60768美國USAKT832822BVDV-2/USMARC-60779美國USAKT832823BVDV-2/USMARC-60780美國USAKX096718BVDV-2/HB-1511中國ChinaLC006970BVDV-2/KZ-91-CP日本JapanMG879027BVDV-2/CN10.2015.821意大利ItalyMH806434BVDV-2/125c美國USAMH806435BVDV-2/1336H美國USAMH806436BVDV-2/296c美國USAMH806437BVDV-2/9231美國USAMH806438BVDV-2/McCart_c美國USAAB871953BVDV-3/D32/00_'HoBi'日本JapanFJ040215BVDV-3/Th/04_KhonKaen泰國Thailand
續(xù)表1 Continuedtable1檢索號Accession病毒株Virusstrain國家CountryHQ231763BVDV-3/Italy-1/10-1意大利ItalyJQ612704BVDV-3/Italy-83/10-ncp意大利ItalyJQ612705BVDV-3/Italy-83/10-cp意大利ItalyJX469119BVDV-3/JS12/01中國ChinaJX985409BVDV-3/CH-KaHo/cont瑞典SwedenKC297709BVDV-3/LVRI/cont-1中國ChinaKC788748BVDV-3/Italy-129/07意大利ItalyKJ627179BVDV-3/Italy-68/13ncp意大利ItalyKJ627180BVDV-3/Italy-68/13cp意大利ItalyKU563155BVDV-3/HN1507中國ChinaKY683847BVDV-3/SV757/15巴西BrazilKY762287BVDV-3/PB22487巴西BrazilKY767958BVDV-3/SV478/07巴西BrazilAF037405BDV/X818德國GermanyAF326963CSFV/Eystrup瑞士Switzerland
1.2.1 構建BVDV分子進化樹 檢索并整理BVDV及BDV、CFSV的RNA聚合酶(RdRP)基因序列以及5′UTR序列,用生物信息學軟件MEGA中的N-J法構建分子進化樹.
1.2.2 計算、分析BVDV密碼子數據 用軟件CodonW中的Correspondence analysis功能模塊,對RSCU、密碼子使用(codon usage)和氨基酸使用(amino acid usage)進行對應分析(correspondence analysis,COA),其原理和計算方法如下:
在對基因密碼子使用概率分析時,將每1條基因作為1個對象,相對密碼子使用度作為變量,采用59個同義密碼子[去除編碼蛋氨酸(M)的密碼子AUG和編碼色氨酸(W)的密碼子UGG以及3個終止密碼子]的RSCU值對其密碼子使用偏性進行分析,基因間的距離規(guī)定為同義密碼子相對使用度的歐拉平方距離.對于基因a與基因b,其密碼子使用距離的計算公式為:
計算完成后,用Excel對RSCU、codon usage和amino acid usage的COA數據作圖,以Axis1為橫坐標、Axis2為縱坐標,分析數據特征[12-13].
1.2.3 密碼子統(tǒng)計數據的聚類分析 運用統(tǒng)計軟件Statistica 12分析上述BVDV密碼子對應分析數據.用Cluster Analysis中的Joining(Tree Clustering)進行聚類分析,參數設置為Amalgamation(linkage)rule:Single Linkage;Distance measure:Euclidean distances
基于BVDV、BDV、CFSV病毒RdRP基因的分子進化樹顯示,BVDV-1、BVDV-2、BVDV-3分別形成了3個大的分支;在以BDV、CFSV為外群的情況下,BVDV-1和BVDV-2親緣關系最近,BVDV-3與二者關系稍遠;各型的病毒株都處于相應的分支上,部分來自同一地區(qū)或國家的分離株都聚在同一較小分支上,表明這些分離株關系最近(圖1-A),如分離自德國的BVDV-2/D37-13-2_Dup(-)等12株BVDV-2型毒株和分離自意大利的BVDV-3/Italy-1/10-1等6株BVDV-3型毒株都聚在同一個小分支上;但BVDV-1型的分離株沒有典型的地區(qū)近緣性.基于5′UTR序列的分子進化樹結果與RdRP基因的分析結果類似,3型BVDV分屬于不同分支,但在各型內部不同病毒株的分支關系上,兩者存在一定差距(圖1-B),分離自德國的BVDV-2/D37-13-2_Dup(-)等12株BVDV-2型毒株間的關系和基于RdRP基因分析的結果則表現一致.
CodonW計算所得BVDV密碼子使用對應分析(COA)數據分析顯示,不同類型的BVDV在RSCU、密碼子使用和氨基酸使用方面具有型特異性(圖2).BVDV-1、BVDV-2、BVDV-3在RSCU和密碼子使用上的COA數據分布模式高度相似,3個基因型的分布相對集中于不同象限中,其中BVDV-3基因型全部聚于第一象限.BVDV-1的數據主要分布于第四象限,BVDV-2則主要位于第二象限,兩型數據有一定離散,但無交叉分布(圖2-A~B).在氨基酸使用方面的數據分布情況類似于RSCU和密碼子使用,但所屬象限不同,BVDV-3全部位于第三象限,BVDV-1主要位于第二象限,BVDV-2則主要位于第四象限.以上結果表明不同基因型BVDV在RSCU、密碼子使用和氨基酸使用方面存在差異,且相對于其他2種基因型來說,BVDV-2和CSFV、BDV的COA數據分布更為接近.
A:基于RdRP的進化樹;B:基于5′UTR的進化樹.
A:相對同義密碼子使用度對應分析;B:密碼子使用對應分析;C:氨基酸使用對應分析.
RSCU、ENC對應分析數據的聚類分析結果顯示(圖3),BVDV-1、BVDV-2、BVDV-3分別聚集形成一個大類,和基于RdRP基因以及5′UTR序列的分子進化樹有高度統(tǒng)一性;CSFV、BDV和BVDV-1、BVDV-2關系較近,BDV和BVDV-1、BVDV-2關系則更近;來自同一地區(qū)的分離株聚在一起,基本處于同一個分支上.
由BVDV-2型病毒株的聚類分析和分子進化樹結果可見,發(fā)現于德國且分離于同一宿主的BVDV-2/D37-13-2_Dup(-),BVDV-2/D75-13-609_Dup(-),BVDV-2/NRW 12-13_Dup(-)等12株病毒株聚為一類,不僅說明其親緣關系高度接近,還提示在密碼子使用偏好性上這些病毒株也具有高度相似性.來自美國的BVDV-2/USMARC-60764,BVDV-2/USMARC-60765等6株病毒分離株也處于同一較大分支上,表示其在親緣關系和密碼子使用上比較接近.此外,來自日本的BVDV-1/No.12_E+和BVDV-1/No.12_E-,來自中國的BVDV-1/BJ1305和BVDV-1/BJ1308以及來自意大利的BVDV-1/VE/138cp/05和BVDV-1/VE/138ncp/05分別聚類于較小分支上,其結果和分子進化樹結果一致.
瘟病毒基因組的遺傳進化主要來自3個不同的過程:由病毒RNA依賴性RNA聚合酶的易錯性導致的點突變的積累;非同源RNA的重組;同源RNA的重組[14].Weber MN等再對125個完整的瘟病毒序列分析后指出,其中2個BVDV-1、1個BVDV-2 和4個CSFV毒株的基因組是由同源重組進化而來[15].重組瘟病毒的存在對病毒分離株的系統(tǒng)發(fā)育分析和分型提出了挑戰(zhàn).雖然RNA重組是產生各種病毒變異體的主要動力,但越來越多的BVDV亞基因型的存在是隨著時間積累的點突變的結果,也稱為遺傳漂移[16].因此,利用不同的方法對這些病毒進行分型研究,有助于揭示病毒進化的規(guī)律,具有重要意義.
圖3 BVDV密碼子COA數據聚類分析
目前,BVDV的分型研究受到了學者的廣泛關注,主要是基于病毒基因組序列的分析結果對毒株進行分型,如5′UTR區(qū)域,以及Npro、E2等基因的序列特征.本研究以BVDV的RdRP基因和5′UTR序列分別進行了分子進化樹的構建,基于這2種序列的BVDV分型結果基本一致,但在每個型內的不同分離株間的親緣關系上存在較大差異.通常分子進化樹的構建是基于瘟病毒屬的RdRP基因序列進行的,二者產生差異的原因可能與5′UTR 序列在執(zhí)行功能時的高級結構相關.此外,本研究利用基因密碼子偏好性參數進行對應分析和聚類分析,結果顯示,利用BVDV的RdRP序列以及5′UTR序列構建的分子進化樹與BVDV密碼子數據聚類分析結果相似,在型特異性上兩種方法所得結果高度一致;COA數據分析顯示,BVDV3個基因型的分布相對集中于不同象限中,其中BVDV-3基因型較為集中,BVDV-2和CSFV、BDV的COA數據分布更為接近,不同類型的BVDV在RSCU、密碼子使用和氨基酸使用方面表現出了高度的型特異性.在每個BVDV型內部,不同分離毒株也具有相似的密碼子偏好性,如分離于同一國家同種宿主動物的分離株具有很近的親緣關系,密碼子偏好性也相似.此外,來自亞洲不同國家的分離株,BVDV-1/AV69 VEDEVAC、BVDV-1/GX4、BVDV-1/KE9、BVDV-1/12F004和BVDV-1/BJ-2016也聚為一類,關系較近.值得注意的是,來自日本的BVDV-2/GBK_E-和來自美國的BVDV-2/USMARC-60767,來自意大利的BVDV-3/Italy-68/13cp和來自中國的BVDV-3/HN1507也分別聚在一起,反映了這幾株病毒基因組在起源與演化過程中可能具有一定的關系.這將為研究基于密碼子使用模式的系統(tǒng)進化分析提供更多的證據.除了上文提到的相同結果外,也有一些明顯的例外.例如,BVDV-1/LETIZIA和BVDV-1/IZSUM在2種系統(tǒng)發(fā)育分析上結果一致,但在密碼子聚類分析中二者各自聚為一類;還有BVDV-2/USMARC-60767和BVDV-2/USMARC-60779為同一地區(qū)同一宿主分離的病毒株,但在密碼子使用偏性上卻存在較大差異,其原因可能與BVDV-2/USMARC-60779基因組因測序不準確存在的15個不可翻譯密碼子有關.
生物體遺傳信息的傳遞遵循“中心法則”,存在于DNA中的遺傳信息在通過轉錄、翻譯后,最終形成擁有生物功能的蛋白質[17].上述過程中最重要的一個環(huán)節(jié)是以三聯(lián)體密碼的形式編碼蛋白質的結構單元-氨基酸[18].基因編碼由64個密碼子構成,但只有61個密碼子編碼20個標準氨基酸,其余3個為終止密碼子,即TAA、TAG和TGA.由于遺傳密碼的簡并性,大多數氨基酸由2-6個密碼子編碼,編碼同一種氨基酸的密碼子稱為同義密碼子.通常來說,某一物種或某一基因傾向于使用一種或幾種特定的同義密碼子.Ikemura曾指出高表達基因具有更強的密碼子使用偏好性[19],還有一些研究揭示了密碼子偏好性現象在進化速率估計和系統(tǒng)發(fā)育重建中的重要性[20].如前所述,部分病原微生物基因組密碼子使用研究表明,密碼子使用偏性與病原種類有密切關系,密碼子使用對應分析數據的聚類分析,可以作為一種參考方法應用于物種鑒定中.