閆曉敏,任照文,涂長春,何 彪
(1.福建農林大學動物科學學院蜂學學院,福州350002;2.軍事醫(yī)學研究院軍事獸醫(yī)研究所,長春130122)
近年來,新發(fā)、突發(fā)傳染病以及外來病給我國畜禽養(yǎng)殖與公共衛(wèi)生帶來嚴重挑戰(zhàn),準確而快速確診是有效防控和阻止疫情擴散的重要前提。傳統(tǒng)病原分離鑒定、抗原抗體反應以及以PCR為基礎的核酸檢測雖然在疫病診斷中發(fā)揮了不可或缺的重要作用,但是上述方法只能針對已知病原體,而且通常需要嚴格的實驗室條件,對新發(fā)未知病原的檢測存在技術局限性。隨著Illumina測序和PacBio單分子高通量測序技術的發(fā)展,病原診斷策略得以極大改進,但由于儀器昂貴,樣品前期制備周期長、建庫起始核酸量要求嚴格,且存在擴增偏好性,缺乏本地測序能力,加上將樣本運送到遠程測序設施的實際困難,無法短時間內完成檢測。納米孔測序作為新興三代測序技術在臨床病原檢測中展示出了較強的應用前景,由于該技術具有單分子測序、長讀長及實時數(shù)據(jù)分析等優(yōu)點,在基因組和轉錄組研究中得到越來越廣泛的應用,顛覆了人們對高通量測序和疾病診斷的理解[1]。牛津納米孔技術公司(oxford nanopore technologies,ONT)MinIONTM測序儀,重量僅90 g,攜帶方便,文庫構建簡單快速,適用于疫情現(xiàn)場實時診斷和數(shù)據(jù)分析[2]。2017年,F(xiàn)aria等[3]利用MinION在資源有限的巴西疫區(qū)對寨卡病毒和黃熱病毒進行了全基因組多重擴增子測序,成功地建立了實時監(jiān)測平臺。2018年,尼日利亞暴發(fā)拉沙熱疫情。由于拉沙熱病毒的高度變異,很難通過特異性PCR擴增病毒的全基因組,英國科學家通過隨機PCR擴增結合納米孔測序在疫區(qū)現(xiàn)場實時完成了病毒的檢測和全基因組測序分析[4]。
作為全球最大的生豬養(yǎng)殖和消費國,2018年8月份ASF入侵了我國,隨后快速蔓延至全國[5],并于當年11月傳播到了東北地區(qū)。ASFV一旦在野豬群流行傳播,將為我國ASF防控和消滅帶來新的困難,因此,開展野豬疫情監(jiān)測與防控對阻止病毒在野豬群的流行十分必要。為開發(fā)準確可靠的快速實時檢測技術,及時獲取病原的基因信息,本研究采用先進的納米孔快速測序技術對未知病原的臨床樣品直接進行高通量測序,基于在線分析平臺實時分析成功地診斷了一起野豬ASF疫情。建立的方法在新發(fā)或突發(fā)疫情的快速診斷以及未知病原的快速鑒定中具有重要的應用前景。
1.1 樣品信息和核酸提取 2019年2月,內蒙古自治區(qū)阿爾山市大興安嶺重點國有林管局桑都爾林場散養(yǎng)野豬發(fā)生不明原因疫情,222頭野豬中210頭死亡,解剖發(fā)現(xiàn)病死豬脾臟顯著腫大至正常脾臟的5~6倍且易碎,呈暗紅發(fā)紫狀態(tài),疑似ASF。該養(yǎng)殖場采集一份脾臟樣品送檢,在P2+生物安全實驗室條件下,在樣品中加入裂解液滅活病原,隨后加入MEM研磨,4℃、8000×g離心10 min后取上清液,用病毒基因組DNA/RNA提取試劑盒(TIANGEN,DP315)提取總核酸,50 μL無酶水洗脫后,RNA核酸分子通過Maxima H Minus Double-Stranded cDNA Synthesis Kit(Thermo Fisher Scientific K2561)合成雙鏈cDNA,通過普通DNA產物純化試劑盒(TIANGEN,DP204)完成DNA與cDNA的產物純化,采用Qubit dsDNA HS分析試劑盒在Qubit4.0核酸定量儀中完成核酸定量,NanoDrop1000測定核酸純度,然后分裝儲存于-80℃超低溫冰箱待用。
1.2 Nanopore建庫測序
1.2.1 快速建庫測序 純化后的DNA與cDNA等量混合,參照納米孔快速建庫測序(RAD004,ONT)流程在10 min內完成文庫構建。將測序芯片(FLOMIN106,R9.4.1)組裝至MinION測序儀中,通過USB 3.0接口將MinIONTM與電腦(Intel(R) core(TM) i7-7700 @3.60 GHz;16.0 GB內存;1 TB SSD)連接。將測序文庫通過Spot-ON樣品端口加入到芯片后,啟動離線版本MinKNOW,并實時開啟EPI2ME云分析平臺(https://epi2nanoporetech.com)。17 h 20 min后終止此次測序,使用Wash kit(WSH003,ONT)清洗芯片后,儲存于4℃冰箱。
1.2.2 連接法建庫測序 為驗證不同建庫方案對病原體檢測的時效性與準確性,進一步參照連接法測序(LSK109, ONT)說明構建測序文庫,并將制備好的文庫加載到R9芯片上進行1D測序,文庫制備流程耗時90 min。此外,由于單張芯片測序通量限制,采用3張測序芯片并行完成連接測序,單次測序運行24 h。
1.3 非洲豬瘟病毒的定性與定量檢測 通過世界衛(wèi)生組織(Office International dés Epizooties,OIE)推薦的引物與特異性實時熒光定量PCR檢測技術[6],對野豬源ASFV做進一步驗證與定量檢測。特異性PCR產物經瓊脂糖凝膠分析,膠回收目的片段,構建標準質粒,并按照101~108copies/μL稀釋8個梯度。熒光定量PCR程序設定:95℃預變性5 min;95℃變性10 s,55℃退火 10 s收集熒光,45個循環(huán)。
1.4 Sanger全基因組測序 參照ASFV Georgia 2007毒株[7](GenBank登錄號:NC044959.1)的全基因組序列設計329對引物序列,采用一代Sanger技術進行基因組測序,根據(jù)擴增片段的重疊區(qū)域進行SeqMan全基因組拼接,該部分測序與拼接工作由吉林省庫美生物科技有限公司完成。
1.5 生物信息學分析
1.5.1 Nanopore數(shù)據(jù)分析 通過cd-hit軟件的默認參數(shù)對原始數(shù)據(jù)(Raw data)去除接頭,F(xiàn)iltlong軟件過濾小于300 bp的短片段和平均質量值小于7的低質量的序列,得到總的Clean data用于后續(xù)分析,并通過NanoPlot進行數(shù)據(jù)統(tǒng)計分析。BWA-MEM[8]采用默認參數(shù)將過濾后的數(shù)據(jù)映射到本地核苷酸序列數(shù)據(jù)庫,并對得到的病毒序列進行在線BLAST驗證。
1.5.2 ASFV有參組裝與可視化分析 利用Minimap2[9]將測序數(shù)據(jù)比對到Sanger全基因組,Miniasm進行基因組拼接。Samtools[10]進行數(shù)據(jù)排序,并建立索引。通過Integrative Genomics Viewer(IGV)可視化序列覆蓋度,以及序列的插入缺失情況。
1.5.3 多序列比對與系統(tǒng)發(fā)育分析 對Sanger測序及Nanopore測序獲得的序列進行隨機篩選,得到ASFV D345L基因的603 bp部分重合片段,采用MEGA 7.0[11]進行多序列比較及系統(tǒng)發(fā)育分析,并利用最大似然法中的Tamura3-parameter模型以及Bootstrap1000構建系統(tǒng)發(fā)生樹。
2.1 未知病原的快速檢測 臨床研究中,在短期內實現(xiàn)新發(fā)突發(fā)病原體的快速檢測與鑒定對于重大突發(fā)疫情的應急處置與防控工作至關重要。牛津納米孔公司的MinIONTM測序儀小巧便攜,可快速布防于條件受限的疫區(qū),在疫情現(xiàn)場與筆記本電腦和無線WiFi連接,即可實時讀取數(shù)據(jù)完成病原體的快速檢測。美國農業(yè)部在2019年借助MinIONTM測序儀對于實驗室分離培養(yǎng)的ASFV毒株以及實驗感染豬的全血樣本進行富集后在短期內快速檢測到了ASFV的特異序列[12]。本研究直接針對疑似野豬臨床脾臟樣本,在樣本送達實驗室后150 min內即完成了樣品的前期制備,經10 min快速構建文庫,結果在測序4 min時首批獲得1.25 kb的序列讀數(shù)(reads),實時數(shù)據(jù)量806.98 kb,同步EPI2ME數(shù)據(jù)時分析比對得到了有效覆蓋ASFV全基因組的特異性序列,在獲取序列的時效性上遠優(yōu)于其他測序平臺。測序運行17 h 20 min后共計獲得1.06 GB原始測序數(shù)據(jù),共計553 071條reads。通過生物信息分析流程比對得到367條病毒reads,其中213條(58.04%)比對為ASFV基因序列,其余為豬內源性逆轉錄病毒(16.89%)、豬巨細胞病毒(25.07%)。此外還獲得103 020條噬菌體序列,由于樣品處理前期未去除宿主基因組,因而宿主基因組序列占據(jù)全部reads的81.31%。對于復雜稀缺的臨床樣本類型,可根據(jù)實際需求去除宿主基因組,實現(xiàn)樣本富集從而節(jié)約測序成本獲取更多有效數(shù)據(jù)。另一方面,將Nanopore測序技術與病毒宏基因組研究手段相結合可滿足于疫情突發(fā)時對未知病原快速檢測需求。
2.2 ASFV的熒光定量檢測 為驗證上述結果,采用ASFV P72基因特異PCR對野豬脾臟組織樣本進行了檢測,結果成功地擴增出了250 bp目的片段(圖1),確診野豬樣品為ASFV陽性,與納米孔測序結果完全一致。進一步熒光定量PCR方法對該樣品進行ASFV基因定量檢測,結果顯示病毒載量為2.1E+6 copies/200 mg。該樣品中的病毒量相對較高,且ASFV基因組較大,Nanopore測序技術針對此類臨床樣本無需PCR擴增直接建庫測序,由此表明,Nano pore測序技術非常適用于ASF的臨床快檢應用。
2.3 Sanger全基因組測序結果 經Sanger測序技術最終獲得該樣品ASFV毒株基因組全長189 403 bp,命名為InnerMongolia-AES01。截取其P72基因在NCBI網站進行在線BLAST分析,結果顯示,該序列與ASFV Georgia 2007株、中國流行毒株同源性為100%,同屬于基因Ⅱ型。該毒株全基因組包含188個ORFs,序列已上傳至GenBank數(shù)據(jù)庫,登錄號為MK940252。
圖1 非洲豬瘟病毒P72基因的PCR擴增Fig.1 PCR amplified P72 gene from ASFV
2.4 納米孔測序結果
2.4.1 測序數(shù)據(jù)統(tǒng)計分析 將原始測序數(shù)據(jù)過濾后進行NanoPlot統(tǒng)計分析,結果見表1。從表中可以看出通過連接法(LSK)測序獲得的數(shù)據(jù),無論在測序通量或者是測序讀長與序列質量方面,均優(yōu)于快速測序方案,對3次連接測序結果進行分析,原始數(shù)據(jù)過濾后獲得9.0 GB過濾后數(shù)據(jù),與核苷酸數(shù)據(jù)庫比對后獲得到1826條ASFV序列,最快得到ASFV序列耗時3 h。本研究通過比較分析快速測序和連接法發(fā)現(xiàn),連接法獲取病原微生物的時效性較差,但是序列質量更高,適用于病原基因組特征的研究。
表1 過濾后測序數(shù)據(jù)統(tǒng)計Table 1 Statistics of Nanopore clean data
2.4.2 ASFV序列統(tǒng)計 圖2表明,經Nanopore快速測序與連接測序方案共同獲得的2039條ASFV序列與Sanger測序獲得的全基因組數(shù)據(jù)(GeneBank登錄號:MK940252)相比較,同源性為74.32%~100%,最短讀長僅116 bp,最長讀長19 821 bp,覆蓋ASFV基因組的10.46%,大多數(shù)序列讀長在500~5000 bp,在序列讀長方面遠優(yōu)于二代illumina測序,但是序列準確度僅為77.78%與85.64%,不及其他測序平臺得到的數(shù)據(jù)準確高。
圖2 ASFV序列讀長與同源性分布圖Fig.2 ASFV sequence read length and identity
2.4.3 ASFV序列的可視化 本研究通過Minimap2軟件將Nanopore測序數(shù)據(jù)比對到ASFV參考基因組,并借助IGV軟件將比對結果進行可視化。從圖3可以看出測序所得序列對ASFV全基因組序列覆蓋度良好,單位點平均測序深度5.02,最大測序深度14,整體ASFV序列覆蓋率達99%。圖3、圖4顯示,Nanopore測序數(shù)據(jù)存在大量的插入與缺失。圖4中紅色標記的SQK-RAD04與SQK-LSK109序列中能直觀觀察到多個位點存在1~2個堿基的插入與缺失,由此,導致兩者與Sanger測序獲得的AES01株親緣關系偏離,但是所得到的序列仍與ASFV基因Ⅱ型株序列處于同一進化分支,表明Nanopore測序所得數(shù)據(jù)雖能判定病毒種類但其準確度仍存在較大改進空間。對于Nanopore測序得到的reads非偶然的片段插入與缺失,需要提高測序深度或者采用2+3的組裝策略才能獲得高質量的全基因組序列。因而將兩種建庫策略獲得的ASFV特異性序列進行初步組裝后覆蓋了99%的全基因組序列,但是由于測序深度的限制,導致拼接后的序列仍存在個別位點的插入與缺失。下一代測序(next generation sequencing,NGS)技術能夠獲得良好的基因組覆蓋深度,但是短讀長的技術特點以及測序中引入的擴增會使得組裝結果的片段化。ASFV基因組兩端為反向重復序列,因而需要利用Nanopore測序產生的長讀長序列構建基因組框架,進一步借助NGS平臺填補框架,從而在短期內完成基因組拼接工作。劉翟等[13]借助通量更高的Nanopore PromethION平臺以及NGS測序平臺采用2代+3代測序組裝策略完成了ASFV病毒分離株的測序與全基因組拼接工作,對于大基因組精準組裝方面具有重要參考意義[13]。但是PromethION測序儀相對于掌上MinIONTM測序儀可移動性較差,不利于疫情暴發(fā)現(xiàn)場測序平臺的快速布置,因而對于新發(fā)突發(fā)與再發(fā)病原體的快速識別與鑒定方面,Nanopore MinION測序平臺仍有不可比擬的應用優(yōu)勢。
綜上,本研究基于先進的Nanopore測序與便攜式高性能計算機平臺在4 min內于一起發(fā)病的家養(yǎng)野豬體內實時檢測到了ASFV的特異性序列,一方面,實現(xiàn)了對臨床樣品ASFV的快速檢測,表明 Nanopore測序技術在新發(fā)或突發(fā)傳染病的快速診斷以及未知病原的快速鑒定中具有重要的應用價值;另一方面,本研究明確了ASF在家養(yǎng)野豬群中的傳播與流行,進而擴大了ASF的宿主與地理分布范圍,提示在ASF疫情的消滅戰(zhàn)役中應注意加強對野豬群的監(jiān)測與防控。
圖3 IGV ASFV序列的可視化比對Fig.3 Visual aligment ASFV sequence by IGV
圖4 基于重合片段構建的系統(tǒng)發(fā)育樹及相關序列的可視化結果Fig.4 Visualization of phylogenetic trees and related sequences based on coincidence fragments