張 雯 杜鵬程 王海印 于偉文 張媛媛 陳 晨*
(中國(guó)疾病預(yù)防控制中心傳染病預(yù)防控制所生物信息室,北京 102206)
腸桿菌科菌株基因組水平上的遺傳差異(ANI)及其在菌種鑒定上的應(yīng)用
張 雯 杜鵬程 王海印 于偉文 張媛媛 陳 晨*
(中國(guó)疾病預(yù)防控制中心傳染病預(yù)防控制所生物信息室,北京 102206)
本研究探討了高通量測(cè)序方法在腸桿菌科菌種鑒定中直接應(yīng)用的可能性,第一次提出并驗(yàn)證了基因組平均遺傳相似度(ANI)指標(biāo)在腸桿菌科鑒定中的有效性,為該技術(shù)的進(jìn)一步發(fā)展提供了數(shù)據(jù)積累。
腸桿菌;基因組;ANI;菌種鑒定
腸桿菌科(Enterobacteriaceae)細(xì)菌是與人類關(guān)系最為密切的一類細(xì)菌,廣泛分布于人與動(dòng)物的糞便、水、土壤和腐物中,包含多種重要的腸道致病菌,如痢疾桿菌和致病性大腸桿菌等。腸桿菌科菌具有一些共同的特征:革蘭染色陰性,桿狀,無(wú)芽孢等,并基于此發(fā)展出一系列檢測(cè)方法(分類培養(yǎng)+生化反應(yīng)+血清分型+毒力試驗(yàn))。傳統(tǒng)方法檢測(cè)需經(jīng)富集培養(yǎng)、分離培養(yǎng)、形態(tài)特征觀察、生理生化反應(yīng)、血清學(xué)鑒定以及必要的動(dòng)物試驗(yàn)等過(guò)程,步驟繁瑣費(fèi)時(shí),一般7d才能獲得較確切的結(jié)果,難以及時(shí)指導(dǎo)疾病的治療。另外,對(duì)于難以培養(yǎng)的,或者生化反應(yīng)差異模糊的,種系發(fā)生關(guān)系密切的近緣物種(如大腸埃希氏菌和志賀氏菌),很難依靠這些方法鑒定[1]。
表1 腸桿菌科15個(gè)屬的ANI值列表
隨著分子生物學(xué)技術(shù)的發(fā)展,對(duì)腸桿菌科細(xì)菌分子鑒定的技術(shù)逐漸成熟。典型的技術(shù)手段如16S rDNA/MLST[2]。相對(duì)于傳統(tǒng)鑒別方法,分子檢測(cè)具備靈敏度高、檢測(cè)快捷的優(yōu)點(diǎn),既可用于分離的細(xì)菌,也可直接用于糞便、食物或環(huán)境水樣品等的快速檢測(cè),但存在自動(dòng)化程度低、一次檢測(cè)信息量有限、難以實(shí)現(xiàn)高通量篩檢、對(duì)未知來(lái)源或新出現(xiàn)的菌株鑒定難度大等不足[3]。發(fā)展中的高通量測(cè)序技術(shù)正可以彌補(bǔ)這些不足。
近年來(lái)隨著454、Illumina、Solid等第二代高通量測(cè)序技術(shù)的大規(guī)模應(yīng)用,已有越來(lái)越多的微生物基因組完成測(cè)序。截止2012年10月,美國(guó)國(guó)家生物技術(shù)信息中心(以下簡(jiǎn)稱NCBI)的GenBank數(shù)據(jù)庫(kù)中已有1183個(gè)細(xì)菌全基因組序列。通過(guò)對(duì)以上細(xì)菌進(jìn)行比較基因組學(xué)研究,可以從基因組水平研究細(xì)菌進(jìn)化的機(jī)制,為細(xì)菌分類、分型提供依據(jù)[4]。已完成的對(duì)部分細(xì)菌的比較基因組學(xué)研究表明,每個(gè)分類群僅有10%~20%的基因是特異的,在其他種類中沒有同源基因[1]。因此,通過(guò)對(duì)腸桿菌科的所有基因進(jìn)行比較分析,可以探索直接利用高通量測(cè)序結(jié)果進(jìn)行菌種鑒定的方法的可能性,同時(shí)也可以從中找出新的鑒定候選位點(diǎn),進(jìn)一步提高菌種鑒定的可靠性。
1.1 腸桿菌科基因組序列的獲得
本文選用了包括大腸桿菌、鼠疫桿菌、志賀氏菌等在內(nèi)的已有全基因組序列的102株細(xì)菌(15屬,36種),從Genbank數(shù)據(jù)庫(kù)(ftp∶//ftp. ncbi.nih.gov/genomes/Bacteria)下載了其全基因組序列及注釋文件。
1.2 全基因組比對(duì)并計(jì)算ANI(Average Nucleotide Identity)
使用BLAST(Basic Local Alignment Search Tool,version 2.2.17)[5]對(duì)102個(gè)菌株的基因序列進(jìn)行兩兩比對(duì)比對(duì),篩選掉序列相似性60%以下或者比對(duì)序列比例70%以下的基因。對(duì)于擁有多條比對(duì)結(jié)果的基因,僅考慮其相似性最高的比對(duì)結(jié)果?;蚪M比對(duì)結(jié)果中,比對(duì)序列的總長(zhǎng)度為L(zhǎng),比對(duì)序列中完全相同的位點(diǎn)總數(shù)為I,則兩菌株的Average Nucleotide Identity (ANI)=I/L[6]。
在本文中,通過(guò)對(duì)腸桿菌科15個(gè)屬(其余各屬不包含測(cè)序菌株)36種102株細(xì)菌進(jìn)行基因組兩兩比對(duì)(表1)。結(jié)果顯示,除埃希氏菌屬和志賀氏菌屬外,腸桿菌科同一屬內(nèi)的菌株間的ANI值都高于不同屬間的ANI值(圖1)。以耶爾森氏菌屬(Yersinia)為例,13株耶爾森氏菌間的平均ANI值為0.96,顯著高于其他14個(gè)屬比對(duì)的ANI值(P<0.05,表1)。相同的情況也存在于其他12個(gè)屬。
由此可見,菌株間ANI值可作為基因組水平遺傳差異水平的標(biāo)志,直接反應(yīng)兩者之間的親緣關(guān)系,ANI值越高,親緣關(guān)系越近;反之,ANI值越低,則序列差異越大,基因差異較多,菌株的表型和生化特征也會(huì)有較大差異。
圖1 腸桿菌科15個(gè)屬的ANI值
目前,微生物全基因組測(cè)序雖然已在實(shí)驗(yàn)室領(lǐng)域是較成熟的技術(shù),但高通量測(cè)序在臨床中直接應(yīng)用到菌種的鑒定分型中還不多。本研究探討了高通量測(cè)序方法在腸桿菌科菌種鑒定中直接應(yīng)用的可能性,第一次提出并驗(yàn)證了ANI指標(biāo)在腸桿菌科鑒定中的有效性,為該技術(shù)的進(jìn)一步發(fā)展提供了數(shù)據(jù)積累。
[1] 杜鵬程,張?chǎng)?劉翟,等.基于同源基因的病原菌鑒定和 分型靶位點(diǎn)的功能基因組學(xué)研究[J].中國(guó)科學(xué),20111,41(9)∶640-648.
[2] Fo GE x,Pechman KR,Woese CR.Comparative cataloging of 16S ribosomal ribonucleic acid∶ molecular approach to prokaryotic systematics[J].Int J Syst Bacteriol,1977,27(1)∶44-57.
[3] Konstantinidis KT,Ramette A,Tiedje JM.The bacterial species definition in the genomic era[J].Philos Trans R Soc Lond B Biol Sci,2006,361(1475)∶1929-1940
[4] Deloger M,El Karoui M,Petit MA.A genomic distance based on MUM indicates discontinuity between most bacterial species and genera[J].J Bacteriol,2009,191(1)∶91-99.
[5] Altschul SF,Gish W,Miller W,et al.Basic local alignment search tool[J].J Mol Biol,1990,215(3)∶403-410.
[6] Oh S,Buddenborg S,Yoder-Himes DR,et al.Genomic diversity of Escherichia isolates from diverse habitats[J].Plos One,2012,7 (10)∶e47005.
R446.5
B
1671-8194(2013)13-0067-02
國(guó)家自然科學(xué)基金青年基金(課題編號(hào)81201322)和艾滋病和病毒性肝炎等重大傳染病防治重大專項(xiàng)(課題編號(hào)2013ZX10003006-002)資助
*通訊作者:E-mail:chenchen@icdc.cn