吳運譜
(遼寧省動物疫病預防控制中心,遼寧 沈陽 110164)
流感病毒作為一種全球性的、重要的公共衛(wèi)生安全威脅。根據世界衛(wèi)生組織估計,全球每年約有300萬~500萬流感患者,并導致了大約29萬~66萬人死亡?;赪eb查詢,IRD可以免費使用,可為流感病毒數據和分析提供一站式服務,并促進關于流感病毒傳播、毒力、宿主范圍和致病性及其新的診斷策略、預防和治療干預措施等方面的發(fā)展。
IRD的數據由來源于GenBank(http://www.ncbi.nlm.nih.gov/genbank/)和UniProt(http://www.uniprot.org)序列數據和序列注釋數據和免疫表位數據庫(IEDB;http://www.iedb.org)的免疫表位數據和蛋白質數據庫 (PDB;http://www.rcsb.org/pdb)的蛋白質三維結構數據等方面數據組成。臨床監(jiān)測和宿主因素的數據來源于直接提交和治療時抗病毒藥物來自于藥物數據庫(http://www.drugbank.ca)。
包括多序列比對、進化樹重構、變異序列確認、適宜于序列元數據的序列比較分析工具(meta-CATS)、BLAST比較、短肽鑒定、PCR引物設計、基因序列注釋、序列特征和表型變異型注釋(Phenotypic Variant Type,PVT)、HA分支分類、HA亞型間的編號換算、檢測數據的可視化和蛋白結構的可視化和宿主因子數據富集分析。
個人數據存儲空間的推出和使用極大地吸引了用對該數據庫的使用,IRD對流感研究重要性的正在逐漸增加,其使用量的穩(wěn)步增加是很好證明。據《流感和其他呼吸道病原》雜志也報道了IRD數據庫論文是該雜志2014年度的應用中排名第一。
IRD允許用戶使用進化樹查看器對基于序列關聯(lián)元數據的進化樹節(jié)點進行著色,包括對地理分布、宿主種類、分離株年份和季度、HA和NA亞型、在特定蛋白質位置上出現的特定氨基酸等特征進行著色標記。用戶利用該工具可提交序列的原始數據,也可使用FASTA格式序列文件或在一個單獨元數據表,結合IRD中的數據,應用IRD中的工具進行分析。用戶利用Archaeopteryx-js進化樹查看器對構建的進化樹進行可視化和修飾,也可通過meta-CATS對序列進行比較而對元數據進行分組。
近年來,流感病毒的一些新蛋白如 PB1-F2蛋白、PB1-N40、PA-N155和PA-N182得到了確認。為了分析這些新發(fā)現的蛋白,IRD團隊開發(fā)了一種注釋算法以預測ORF和PB1-N40、PA-N155、PA-N182等新蛋白的序列。IRD已經注釋了具有變異蛋白的流感片段序列,用戶可以通過核苷酸序列和蛋白質序列檢索頁面圖檢索到,并能轉換為適用于IRD分析工具的形式下載下來。
早期IRD開發(fā)了一種用于研究基因型與表型間的工具——序列特征型變異組件(Sequence Feature Variant Type,SFVT)。該組件整和了流感病毒序列特征(Sequence Features,SFs),SF用于具有特殊結構或功能的蛋白區(qū)域的分析。目前SFVT組件已經擴展到突出變異類型,與已知的、重要的表型特征有關的信息。為應對高致病性H5N1亞型禽流感的暴發(fā),并考慮到宿主范圍、地理區(qū)域,IRD完成了H5N1基因變異方面的探索,以有助于對可能造成的潛在大流行的H5N1毒株的識別。此次研究包括對毒株序列標記相關的表型功能如毒力確定、組織噬性、臨床癥狀、復制能力、聚合酶活性、活化PH值、傳播能力、宿主適應能力、抗病毒藥物活性、敏感溫度等方面的內容。
IRD開發(fā)了一種可以對豬流感病毒HA(H1)序列系統(tǒng)進化進行分類的算法。該算法構建HA參考進化樹,應用pplacer方法將查詢序列置于參考進化樹,從而確定查詢序列最密切相關的譜系。在IRD中所有相關的豬H1序列都已經應用這種方法制定了分支。該工具還可以為對用戶提供的序列進行H1分支預測。鑒于H5N1流感病毒的人畜共患風險及大流行潛力,IRD開發(fā)了H5分支分類工具,以對高致病性和低致病性的H5 HA序列進行分類。
為了比較不同亞型間流感病毒HA蛋白的氨基酸替換、與表型和功能變化相關的位點替代、交叉免疫表位識別等內容,人們對比較不同HA亞型間氨基酸替代的需求不斷增加。但是基于序列進行不同亞型間的殘基間的比較,一直以來都是人們所面臨難題之一。Burke和Smith提出了一個跨亞型的HA編號方案,其針對A、B型流感病毒共18種亞型,結合HA序列和結構數據,提出了不同亞型間的位置功能對等理論。IRD基于此編號方案開發(fā)了HA亞型編碼轉換工具,其允許用戶將一種HA蛋白序列的坐標轉換為基于其他任何亞型HA蛋白序列的相應坐標。該編號轉換工具也與IRD中的其他分析工具如序列變異分析工具和meta-CATS進行了集成,其能夠將分析結果中的坐標轉換成一個不同的坐標系的坐標結果,極大地提升了比對效果。