林毅英,潘力,吳清平,王斌
(1.華南理工大學生物科學與工程學院,廣東廣州 510006)(2.廣東省微生物研究所華南應用微生物國家重點實驗室,廣東廣州 510070)
副溶血性弧菌(Vibrio Parahemolyticus),革蘭氏陰性菌,是人類常見的食源性腸道條件致病菌,常見于冷凍海鮮類食品高消耗的國家。副溶血弧菌通常存在于海洋水域,附著于魚、蝦、蟹及其他軟件動物的體表生長[1,2],人類被其感染后會導致急性腸胃炎[3~5],有可能出現(xiàn)腹瀉、膿血和脫水等癥狀,甚至死亡。對于沿海地區(qū)經(jīng)常食用海鮮制品的人們來說,副溶血弧菌導致的食物中毒比率非常高[6],這類疾病的高發(fā)國家和地區(qū)包括美國及許多亞洲國家(如日本、泰國、馬來西亞和中國等)[7,8]。副溶血弧菌在世界范圍內(nèi)的廣泛分布,使得研究其致病因子及致病機制變得非常重要,以便更好地預防和治療由其導致的食物中毒、腸胃炎等疾病,也對檢測食品中副溶血弧菌污染及食品保鮮具有重要的實際應用價值。
雖然已有研究對副溶血弧菌的致病因子進行報道,例如 Makino等研究表明副溶血弧菌的致病因子包括溶血素、脲酶、Ⅲ型分泌因子 TTSS、Ⅵ型分泌因子T6SS等[3,9],但是副溶血弧菌引起腸胃炎的具體致病機制仍然不清楚。而近年來,隨著抗生素濫用問題的日益加重導致了多重耐藥菌株的出現(xiàn)[8],這更加劇了副溶血弧菌引起腸胃炎等疾病的風險。因此持續(xù)監(jiān)控海鮮制品捕撈、運輸及貨架期過程中的副溶血弧菌菌株污染情況,揭示新發(fā)現(xiàn)菌株的致病因子就顯得十分重要。副溶血弧菌基因組測序能夠獲得全基因組水平的基因注釋及功能分析數(shù)據(jù),能為尋找其致病因子并分析其致病機制提供可靠的遺傳學支持數(shù)據(jù)。
本研究所用的副溶血弧菌菌株 229,分離于冷凍海洋魚類制品,其臨床感染表現(xiàn)為腹痛、嘔吐、腹瀉及水樣便等癥狀。本研究利用Illumina Hiseq 2000測序平臺,制備400 bp測序文庫,采用雙末端90 bp測序技術,對其基因組進行測序。所得數(shù)據(jù)經(jīng)質(zhì)量過濾后,進行基因組組裝、功能基因注釋及基因 WEGO功能聚類分析,目的在于獲得與副溶血弧菌導致腸胃炎等疾病相關的致病因子,為研究副溶血弧菌致病性的遺傳學機制提供有價值的數(shù)據(jù)支持。
1.1.1 菌株
副溶血弧菌菌株 229,用于基因組測序和功能基因注釋,保藏于廣東省微生物所菌株保藏中心,編號為GMIxtf-229。
1.1.2 培養(yǎng)基
高鹽LB培養(yǎng)基:胰蛋白胨1%、酵母提取物0.5%、氯化鈉3%、pH 7.0。培養(yǎng)溫度37 ℃。
1.1.3 化學試劑
Tris-HCl、EDTA、SDS、巰基乙醇、RNaseA 等試劑購自北京普博欣生物科技有限公司;瓊脂糖、核酸染料購自TaKaRa公司;細菌基因組DNA提取試劑盒 DNAzol? Reagent,購自 ThermoFisher Scientific公司;培養(yǎng)基及組分購自廣東環(huán)凱微生物科技有限公司。
1.2.1 文庫構建及測序
副溶血弧菌菌株229在高鹽LB培養(yǎng)基上,37 ℃培養(yǎng) 12 h后,用細菌基因組 DNA提取試劑盒DNAzol? Reagent提取其基因組DNA,溶于100 μL去離子水,并加入 20 μg/mL RNaseA以去除殘留的RNA成分。利用Nano-drop分析儀檢測所得DNA樣品的濃度和質(zhì)量,達到 OD260/280=1.8~2.0的樣品,用于基因組測序文庫的構建:首先采用超聲法 Covaris將大片段DNA隨機打斷,經(jīng)片段長度選擇(400±25 bp)、平末端修復、末端加A、接頭連接等,獲得帶有測序接頭的DNA片段,利用測序接頭引物進行PCR擴增富集DNA片段,電泳回收400±25 bp的PCR擴增產(chǎn)物片段。利用Illumina Hiseq 2000測序平臺進行cluster文庫制備,采用雙末端 90 bp測序策略,在Illumina Hiseq 2000測序平臺上進行副溶血弧菌菌株229的基因組測序。
1.2.2 基因組組裝
原始的測序數(shù)據(jù)會存在一定量的低質(zhì)量數(shù)據(jù),為了使得后續(xù)的分析結果更加準確可靠,在進行基因組組裝之前對原始的測序數(shù)據(jù)進行數(shù)據(jù)過濾處理。依次采用下列步驟對原始數(shù)據(jù)進行質(zhì)量控制:(1)去除帶有接頭污染的reads(默認接頭adapter序列與read序列有15 bp的overlap,允許錯配數(shù)為1);(2)去除含N堿基數(shù)目總和達到一定比例的reads(默認10%,設置為10 bp);(3)去除質(zhì)量值連續(xù)≤4的堿基數(shù)達到一定程度的reads(默認40%,設置為36個)。經(jīng)過濾后的reads數(shù)據(jù),利用Velvet 1.2.10軟件進行基因組從頭組裝,軟件所用參數(shù)采取默認的參數(shù),并根據(jù)測序數(shù)據(jù)進行優(yōu)化組裝結果的優(yōu)化[10]。
1.2.3 基因注釋及功能聚類分析
蛋白質(zhì)編碼基因(coding sequence,CDS),利用軟件Glimmer 3.02進行預測分析[11],并通過NCBI非冗余蛋白數(shù)據(jù)庫進行驗證?;?GO功能注釋通過InterProScan軟件完成,GO功能聚類分析通過WEGO在線程序(http://wego.genomics.org.cn/cgi-bin/wego/index.pl)完成[12]。tRNA 的預測由 tRNAscan-SE version 1.3.1軟件完成[13]。菌株229基因組與副溶血弧菌模式菌株10329基因組的同源比對分析由circos軟件完成。進化樹構建,利用軟件MEGA6完成,采用Neighbor Joining方法建樹,bootstrap參數(shù)設置為1000(即構建1000棵進化樹,在此基礎上整合得到一個進化樹)。
1.2.4 致病因子分析
根據(jù)目前文獻報道的副溶血弧菌的主要致病因子,對菌株229組裝的基因組及注釋的功能基因進行比對分析,預測副溶血弧菌菌株229具有的致病因子,并分析這些致病因子的功能。
圖1 副溶血弧菌229基因組contig覆蓋度及蛋白編碼基因CDS長度的統(tǒng)計分析Fig.1 The statistics analysis of contig coverage and gene length(the amount of amino acids) in the genome of V.parahaemolyticus strain 229
經(jīng)質(zhì)量控制去除低質(zhì)量及接頭污染的reads,基因組測序共獲得14,003,024個90 bp reads,用于基因組組裝的關鍵參數(shù)k-mer數(shù)值設置為71 bp。組裝所得基因組的序列文件提交至NCBI數(shù)據(jù)庫,獲得序列號為MRBW00000000。原始測序raw read數(shù)據(jù)提交至NCBI SRA數(shù)據(jù)庫,獲得序列號為PRJNA356138。
基因組測序和組裝統(tǒng)計信息如表1,共獲得63個contigs(>1000 bp,N50為45,033 bp),最大的contig長度為716,466 bp,所得基因組長度為4.97 Mb,GC含量為 43.90%,測序深度達到 254×,大多數(shù) contig的覆蓋度達到 30~60×(圖 1),所得測序數(shù)據(jù)能夠滿足基因組組裝、功能基因注釋和聚類分析的數(shù)據(jù)量要求。利用Glimmer3.02軟件對組裝的基因組序列進行功能基因注釋,共獲得4,940個功能基因,平均長度達到933 bp,多數(shù)基因的氨基酸數(shù)目少于1000個(圖1),具有功能注釋的基因達到1270個,為分析該菌株導致腸胃炎等疾病的致病因子提供了可靠數(shù)據(jù)。根據(jù)功能基因的平均長度以及預測的基因數(shù)目,可以計算得到副溶血弧菌菌株229的功能基因的序列總長約為4.61 Mb,占其基因組序列總長4.97 Mb的92.76%,說明副溶血弧菌的基因密度很高,基因組上非編碼序列十分稀少,也說明副溶血弧菌基因組具有高度的經(jīng)濟性,符合微生物生存及進化的基本原則:減少基因組冗余序列,降低代謝能耗?;蚪M包含53個tRNA基因,這是副溶血弧菌蛋白質(zhì)基因表達的基礎。
表1 副溶血弧菌菌株229的測序信息Table 1 The sequencing information of V. parahaemolyticus strain 229
圖2 副溶血弧菌229注釋基因的GO功能分析Fig.2 GO functional analysis of annotated genes in the genome of V. parahaemolyticus strain 229
副溶血弧菌基因組中共有1,270個基因獲得GO功能注釋,利用WEGO軟件對具有GO注釋的基因進行功能聚類分析。結果顯示,以下GO類群均富集了10%以上的功能基因:“binding”、“catalytic”、“biological regulation”、 “cellular process”、 “establishment of localization”、“metabolic process”、“pigmentation”等。尤其是以下兩個GO類群富集了大量功能基因(圖2):Biological process categories "metabolic process" (722 CDSs,55.4%) and "localization” (226 CDSs,17.3%),這些基因可能有利于副溶血弧菌菌株對寄主的侵入及其隨后在宿主上的生長、繁殖及代謝過程,這些數(shù)據(jù)為研究副溶血弧菌菌株的致病性的機制提供數(shù)據(jù)支持。
根據(jù)文獻報道,副溶血弧菌導致腸胃炎等疾病的致病因子包括溶血素(hemolysin)、Ⅲ型因子(Type Ⅲsecretion system,TTSS)和Ⅵ型因子(Type Ⅵ secretion system)。其中,熱穩(wěn)定的溶血素因子TDH、TRH是主要的致病因子,研究表明所有的臨床副溶血弧菌菌株至少含有TDH、TRH二者中的一種致病因子[14,15]。
基于基因的功能注釋結果,副溶血弧菌229基因組包括一個溶血素基因(NODE_11_orf00126)以及另外三個與溶血素相關的基因(NODE_24_orf00078、NODE_2_orf00564、NODE_20_orf00001,表 2),這是副溶血弧菌致病性的基礎因子。Ⅲ型因子是副溶血弧菌、志賀氏菌、沙門氏菌的重要致病因子之一,屬于Type Ⅲ secretion system(TTSS)系統(tǒng)。研究表明TTSS系統(tǒng)與副溶血弧菌侵入人類腸道上皮細胞的過程密切相關。對于副溶血弧菌菌株 229,本研究的基因組注釋顯示其 TTSS系統(tǒng)包括四個功能基因(NODE_8_orf00014、NODE_32_orf00049、NODE_2_orf00456、NODE_2_orf00457,表 2)。從這些基因在基因組上的分布情況看,這些致病因子位于不同的染色體位點,因此能夠形成獨立的致病因子簇。副溶血弧菌菌株229的基因組組裝和注釋為研究副溶血弧菌致病性的遺傳學基礎提供了有價值的數(shù)據(jù)。
表2 副溶血弧菌229致病因子注釋及功能分析Table 2 Annotation and functional analysis of virulence factors in V. parahaemolyticus strain 229
圖3 副溶血弧菌菌株229與10329的同源性比較分析Fig.3 The homologous comparative analysis of V.parahaemolyticus strain 229 and 10329
副溶血弧菌菌株229與模式菌株10329的同源性比較(圖 3)表明,二者之間存在大量的同源序列,說明二者同源關系較近,這有助于利用模式菌株10329的基因組信息和基因功能注釋信息,分析副溶血弧菌菌株229的致病因子基因。同時,兩株菌的同源序列存在大量的交錯(圖3),也就是大量的同源序列在基因組上的位置是不一致的,導致這種差別的原因是多樣的,其中之一是基因水平轉(zhuǎn)移機制,這需要深入的遺傳學分析加以確定。
圖4 基于溶血素基因(hemolysin)構建副溶血弧菌菌株系統(tǒng)進化樹Fig.4 Phylogenetic distance tree for V. parahaemolyticus strainsbased on the hemolysin gene
基于溶血素基因(NODE_11_orf00126)的系統(tǒng)發(fā)育分析結果(圖4),表明副溶血弧菌菌株229與擁有O4:K8血清型的菌株BB22OP遺傳距離最近[16]。由于菌株BB22OP與臨床菌株RIMD2210633同源關系十分接近[3,16],推測菌株 229有可能與菌株RIMD2210633一樣具有臨床的致病性。
本研究完成了副溶血弧菌菌株 229的基因組測序、組裝和功能基因注釋。組裝所得基因組序列已提交至NCBI數(shù)據(jù)庫,序列號為MRBW00000000。基因注釋獲得4940個基因,其中1270個基因具有GO注釋。WEGO注釋顯示大量CDS對于副溶血弧菌入侵宿主及隨后的生長、繁殖和代謝等過程發(fā)揮重要作用。
通過基因注釋,獲得了與副溶血弧菌致病性相關的致病毒性因子,包括溶血素hemolysin和Ⅲ型因子,這些因子位于不同的染色體位點,故而形成獨立的致病因子簇。基于溶血素基因(NODE_11_orf00126)的系統(tǒng)發(fā)育分析結果表明,副溶血弧菌菌株229與擁有O4:K8血清型的菌株BB22OP遺傳距離最近,推測菌株229可能具有臨床的致病性。
[1]Letchumanan V, Chan K G, Lee L H.Vibrio parahaemolyticus: a review on the pathogenesis, prevalence,and advance molecular identification techniques [J]. Frontiers in Microbiology, 2014, 5: 705
[2]Malcolm TTH, Cheah YK, Radzi CWJWM, et al. Detection and quantification of pathogenicVibrio parahaemolyticusin shellfish by using multiplex PCR and loop-mediated isothermal amplification assay [J]. Food Control, 2015, 47:664-671
[3]Makino K, Oshima K, Kurokawa K, et al. Genome sequence ofVibrio parahaemolyticus: a pathogenic mechanism distinct from that of V cholerae [J]. Lancet, 2003, 361(9359): 743-749
[4]Nair G B, Ramamurthy T, Bhattacharya S K,et al. Global dissemination ofVibrio parahaemolyticusserotype O3:K6 and its serovariants [J]. Clinical Microbiology Reviews, 2007,20(1): 39-48
[5]Newton A, Kendall M, Vugia D J,et al. Increasing rates ofvibriosisin the United States, 1996-2010: review of surveillance data from 2 systems [J]. Clinical Infectious Diseases, 2012, 54(Suppl 5): S391-395
[6]劉秀梅,陳艷,王曉英,等.1992~2001年食源性疾病暴發(fā)資料分析-國家食源性疾病監(jiān)測網(wǎng)[J].衛(wèi)生研究,2004, 33(6):725-727 LIU Xiu-mei, CHEN Yan, WANG Xiao-ying, et al.Foodborne disease outbreaks in China from 1992 to 2001 national foodborne disease surveillance system [J]. Journal of Hygiene Research, 2004, 33(6): 725-727
[7]Chen Y, Stine O C, Badger J H,et al. Comparative genomic analysis ofVibrio parahaemolyticus: serotype conversion and virulence [J]. BMC Genomics, 2011, 12: 294
[8]Letchumanan V, Ser H L, Tan W S,et al. Genome sequence ofVibrio parahaemolyticusVP152 strain isolated fromPenaeus indicusin Malaysia [J]. Frontiers in Microbiology,2016, 7: 1410
[9]Wang R, Zhong Y, Gu X, et al. The pathogenesis, detection,and prevention ofVibrio parahaemolyticus[J]. Frontiers in Microbiology, 2015, 6(32): 144
[10]Zerbino D R, Birney E. Velvet: algorithms forde novoshort read assembly using de Bruijn graphs [J]. Genome Research,2008, 18(5): 821-829
[11]Delcher A L, Bratke K A, Powers E C, et al. Identifying bacterial genes and endosymbiont DNA with Glimmer [J].Bioinformatics, 2007, 23(6): 673-679
[12]Ye J, Fang L, Zheng H, et al. WEGO: a web tool for plotting GO annotations [J]. Nucleic Acids Research, 2006, 34(Web Server issue): W293-297
[13]Lowe T M, Eddy S R. tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence [J]. Nucleic Acids Research, 1997, 25(5): 955-964
[14]Shirai H, Ito H, Hirayama T, et al. Molecular epidemiologic evidence for association of thermostable direct hemolysin(TDH) and TDH-related hemolysin ofVibrio parahaemolyticuswith gastroenteritis [J]. Infection and Immunity, 1990, 58(11): 3568-3573
[15]Yamaichi Y, Iida T, Park K S, et al. Physical and genetic map of the genome ofVibrio parahaemolyticus: presence of two chromosomes inVibriospecies [J]. Molecular Mcrobiology,1999, 31(5): 1513-1521
[16]Jensen R V, Depasquale S M, Harbolick E A, et al. Complete genome sequence of prepandemicVibrio parahaemolyticusBB22OP [J]. Genome Announcements, 2013, 1(1)