白 云,萬康林
分子生物學技術(shù)的不斷成熟和生物信息學技術(shù)的廣泛應用使生物的分子進化研究取得了迅猛進展。結(jié)核分枝桿菌的分子進化研究為結(jié)核分枝桿菌的溯源、致病機理研究、耐藥性研究及毒力基因相關(guān)研究奠定了堅實的理論基礎(chǔ),同時也為結(jié)核病的預防控制提供重要依據(jù)。特對近年來國內(nèi)外用于結(jié)核分枝桿菌分子進化研究進行綜述。
1.1 結(jié)核分枝桿菌分類學地位 分枝桿菌屬主要包括結(jié)核分枝桿菌復合群(Mycobacterium tuberculosis complex,MTBC)、麻風分枝桿菌(M.leprae)和非結(jié)核分枝桿菌(Non-tuberculous Mycobacteria,NTM)。MTBC主要包括結(jié)核分枝桿菌(M.tuberculosis,MTB)、牛分枝桿菌(M.bovis)、非洲分枝桿菌(M.a(chǎn)fricanum)和田鼠分枝桿菌(M.microti)等。其中結(jié)核分枝桿菌、牛分枝桿菌和非洲分枝桿菌均可感染人類并引發(fā)結(jié)核病。目前,發(fā)現(xiàn)的非結(jié)核分枝桿菌約有160種,其中37種已有病例報告[1]。常見的引起人類疾病的非結(jié)核分枝桿菌主要包括鳥分枝桿菌復合群(M.a(chǎn)vium complex,MAC)、膿腫分枝桿菌(M.a(chǎn)bscessus)和堪薩斯分枝桿菌(M.kansasii)等。
1.2 結(jié)核分枝桿菌起源 分枝桿菌屬的祖先可能為一種自由生物體。與海洋生物發(fā)生長期、持續(xù)性聯(lián)系的分枝桿菌,位于分枝桿菌進化樹的根部,故海分枝桿菌可能相對最為古老。結(jié)核分枝桿菌與MTBC的其他成員,在表型、宿主范圍及致病力方面存在較大差異,但是具有較高的遺傳同質(zhì)性,其基因組水平的序列相似性在99.95%以上,同義核苷酸變異率僅有0.01%~0.03%,并且基因水平轉(zhuǎn)移也很少發(fā)生,所以有科學家認為:MTBC是由同一祖先進化而來,最近的進化瓶頸時期發(fā)生在2萬到3.5萬 年 前[2-4]。Cole 等[5]認 為 H37Rv中 含 有20種帶有單加氧酶的細胞色素P450,這種酶可以催化疏水化合物的氧化,這也是與土壤腐生生物相關(guān)的特性之一,所以結(jié)核分枝桿菌的祖先可能為一種土壤內(nèi)的分枝桿菌。Fabre等[6]認為在非洲發(fā)現(xiàn)的卡耐提分枝桿菌(M.canettii)可能是MTBC中最古老的譜系。Gutierrez等[7]最近的進化研究發(fā)現(xiàn):結(jié)核分枝桿菌的進化與人類相似,可以追溯到3百萬年前的非洲大陸,并認為結(jié)核分枝桿菌的進化與人類的遷徙和進化相關(guān),即:結(jié)核分枝桿菌隨著人類的遷徙由非洲逐漸傳播到世界各地從而形成了目前這種不同基因型的全球分布形式。
2.1 插入序列(insertion sequences,IS)插入序列是廣泛存在于細菌基因組中的一種轉(zhuǎn)座元件。結(jié)核分枝桿菌研究中,常用的插入序列主要包括IS6110、IS1081等。IS6110隸屬于IS3家族,序列長度為1.36kb,僅存在于 MTBC中[8]。包括結(jié)核分枝桿菌在內(nèi)的幾乎所有的MTBC的菌株在直接重復區(qū)都有一個IS6110元件,且此插入位點被認為是MTBC進化過程中最早的插入位點[9]。McEvoy等[10]認為結(jié)核分枝桿菌的進化能力絕大部分可能依賴于IS6110的轉(zhuǎn)座,含有IS6110高拷貝數(shù)的菌株與低拷貝數(shù)的菌株相比具有更高的進化率和更多的進化優(yōu)勢。
2.2 單核苷酸多態(tài)性(Single nucleotide polymorphisms,SNP) SNP是指由單個核苷酸變異引起的基因組序列多態(tài)性。SNP分為同義(synonymous)SNP和非同義(nonsynonymous)SNP。同義SNP是指核酸的改變未造成基因編碼的氨基酸序列改變。非同義SNP是指核酸的改變引起了氨基酸序列的改變。非同義突變可能是種群內(nèi)在因素或者外部環(huán)境壓力引起的趨同進化的結(jié)果。而同義SNP與其他的進化標識相比更少的受到選擇壓力的影響,屬于中性突變,因此,被科學家認為是用于結(jié)核分枝桿菌進化研究理想的分子生物學標識。
2.3 大 片 段 多 態(tài) 性 (Large-sequence polymor-phisms,LSP) LSP是發(fā)生在基因組中容易產(chǎn)生插入-缺失位置的大片段的多態(tài)性。IS6110的重組及其它具有相似序列的基因重組和缺失可能是LSP產(chǎn)生的兩個重要機制[11]。分枝桿菌基因組中的LSP大小一般為105bp到11 985bp。LSP很可能是MTBC大程度遺傳變異與表型變異的重要原因之一。目前LSP是作為進化研究的主要分子標識。Alland 等[11]將 Fleischmann等[12]通過基因組 比對分析所確定的17個LSP劃分為3組,并認為其中包括4個 LSP(LSP 1、9、13、16)的 A 組是用于結(jié)核分枝桿菌進化研究較好的分子標識。
2.4 直接重復片段 (Direct repeats,DR) 直接重復片段是僅出現(xiàn)于結(jié)核分枝桿菌復合群中,大小為36bp的DNA片段,被35~41bp的間隔區(qū)(spacer)分隔開。一個直接重復片段和一個間隔區(qū)共同組成了一個直接可變重復單元(direct variant repeats,DVR),多個 DVR組成整個 DR 區(qū)[13]。DR區(qū)被認為是結(jié)核分枝桿菌進化研究的重要染色體結(jié)構(gòu)域。Fang等[9]認為DR區(qū)的進化主要是由DVR的缺失及IS6110引起的突變等介導。
2.5 可變數(shù)目串聯(lián)重復序列(Variable number tandem repeat,VNTR) 可變數(shù)目串聯(lián)重復序列是存在于基因組中大小為40~100bp的串聯(lián)重復序列。VNTR屬于小衛(wèi)星序列,由中間的核心區(qū)和外圍的側(cè)翼區(qū)兩部分組成,其側(cè)翼序列具有高度的保守性[14]。不同的VNTR在不同的結(jié)核分枝桿菌中重復單元的拷貝數(shù)存在差異,具有高度的多態(tài)性。目前已發(fā)現(xiàn)48個VNTR位點,其中有明顯多態(tài)性的位點有12個[15]。Smittipat等[15]對其研究的48個VNTR位點分析后發(fā)現(xiàn),大多數(shù)VNTR都出現(xiàn)于結(jié)核分枝桿菌的非編碼區(qū)或基因間隔區(qū),有趣的是編碼區(qū)的串聯(lián)重復序列都多變,并編碼多態(tài)性蛋白,這種多態(tài)性蛋白可能在結(jié)核分枝桿菌逃避宿主免疫屏障過程中發(fā)揮重要的作用。
3.1 單核苷酸多態(tài)性分析
3.1.1 管家基因SNP分析 管家基因的變異能夠為生物進化提供重要信息。管家基因SNP相關(guān)進化研究是一種PCR與DNA測序相結(jié)合的方法,利用PCR擴增管家基因片段,應用DNA測序儀確定并驗證不同菌株管家基因中的SNP,進而針對不同結(jié)核分枝桿菌管家基因的SNP應用生物信息學軟件進行相關(guān)進化分析。這種方法相對省時、省力、較為經(jīng)濟,但是由于管家基因高度保守,提供的變異信息較為有限,因此這種進化分析結(jié)果不夠全面。
3.1.2 全基因組多SNP位點分析 隨著基因組測序技術(shù)的發(fā)展,人類獲得越來越多微生物的全基因組序列,基因組序列比對分析提示出更全面的SNP信息。針對新的SNP信息,科學家開始了基于基因組內(nèi)多個SNP位點的進化分析。如:Filliol和Gutacker等[16-17]選擇來自于不同國家地區(qū)的實驗菌株,通過比較基因組學及分子生物學的方法確定并驗證用于進化分析的SNP,根據(jù)不同菌株SNP的信息,應用生物信息軟件開展進化分析。這種方法不僅可以迅速、明確地將處于系統(tǒng)發(fā)育樹不同位置的菌株劃分為不同基因簇,并且為其毒力、感染性等生物醫(yī)學相關(guān)的特性構(gòu)建了基因框架。
3.2 基因缺失分析 基因缺失分析即應用PCR或自動基因芯片技術(shù)及DNA測序相結(jié)合的方法以確定并驗證不同菌株的基因組某一區(qū)域缺失情況,并利用分子生物學軟件進行相應分析。基因缺失分析目前是結(jié)核分枝桿菌進化研究的主要方法之一。常用于缺失分析的區(qū)域為變異區(qū)(regions of difference,RD)區(qū)。除RD區(qū)外,重復序列的缺失分析也是結(jié)核分枝桿菌分子進化研究的方法之一。如:Arnold等[18]根據(jù)VNTR及DR區(qū)spacer的缺失情況并結(jié)合katG、gyrA和gyrB基因的SNP分析結(jié)果繪制了結(jié)核分枝桿菌遺傳事件發(fā)生的時間表,清晰的顯示了MTBC各成員如何從共同祖先進化而來。
3.3 IS6110-熒光標記擴增片段長度多態(tài)性分析曾被認為是結(jié)核分枝桿菌分子分型金標準的方法是IS6110限制性片斷長度多態(tài)性[IS6110-RFLP(restriction fragment length polymorphism)]分析,但因影響IS6110轉(zhuǎn)座的因素較復雜、數(shù)據(jù)分析較繁瑣等原因,使IS6110-RFLP在結(jié)核分枝桿菌的進化研究中一直受到限制。最近Thorne等[19]的研究表明以IS6110-targetting PCR為基礎(chǔ)的一種優(yōu)于IS6110-RFLP的分型方法,IS6110-熒光標記擴增片段長度多態(tài)性[IS6110-fAFLP (fluorescent amplified fragment length polymorphism)]分析可以用于現(xiàn)代結(jié)核分枝桿菌菌株的系統(tǒng)發(fā)育研究。IS6110-fAFLP基本操作方法為:首先,選用限制性內(nèi)切酶MseⅠ、TaqⅠ等將菌株全基因組酶切消化;然后,將消化后DNA加入到含有TaqⅠ特異性接頭的連接液中進行連接反應;連接反應結(jié)束后進行特異的PCR擴增。擴增后的特異片段加樣于ABi 3130xl基因分析儀中并應用GeneMapper v4.0進行分析。分析后的片段作為有效數(shù)據(jù)并運用BioN-umerics version 4.5構(gòu)建系統(tǒng)發(fā)育樹[19-20]。這種方法對Haarlem、LAM、X、T、S等不同基因型都有較好的分辨能力。但不適用于IS6110低拷貝數(shù)的古典型菌株。
3.4 間隔寡核苷酸分型和多位點數(shù)目可變串聯(lián)重復序列分析 間隔寡核苷酸分型(spacer oligonucleotide typing,Spoligotyping)和多位點數(shù)目可變串聯(lián)重復序列分析(multiple locus VNTR analysis,MLVA)是目前國際上用于結(jié)核分枝桿菌快速分型的兩種方法,在結(jié)核分枝桿菌的分子進化研究中常作為輔助方法與其他分子進化研究方法聯(lián)合應用以提供實驗菌株的基因分型信息并豐富進化研究結(jié)果。如:Gutacker 等[17]將 Spoligotyping、MLVA、IS6110分析與基于SNP的系統(tǒng)發(fā)育分析結(jié)合起來,不僅將結(jié)核分枝桿菌劃分為9大基因簇,并且揭示了結(jié)核分枝桿菌穩(wěn)固的種群結(jié)構(gòu)。
4.1 結(jié)核分枝桿菌與牛分枝桿菌的進化關(guān)系 結(jié)核分枝桿菌與牛分枝桿菌是引起人類結(jié)核病的兩大病原菌,二者的進化關(guān)系一直是科學家爭論的焦點。Stead等[21]曾認為結(jié)核分枝桿菌是由牛分枝桿菌進化而來的。然而,比較基因組學分析表明,結(jié)核分枝桿菌不可能直接來源于牛分枝桿菌[22],Brosch等[4]開展的系統(tǒng)發(fā)育研究較深入的構(gòu)建了MTBC的進化結(jié)構(gòu),他推測:牛分枝桿菌、田鼠分枝桿菌及非洲分枝桿菌在TbD1出現(xiàn)之前就從現(xiàn)代結(jié)核分枝桿菌的祖先中分化了出來,牛分枝桿菌與結(jié)核分枝桿菌相比,存在更多的缺失基因,進一步證實牛分枝桿菌是比結(jié)核分枝桿菌更為年輕的致病菌。
4.2 結(jié)核分枝桿菌的年齡 在結(jié)核分枝桿菌的研究中,許多科學家試圖應用分子鐘去追溯結(jié)核分枝桿菌的年齡,但結(jié)核分枝桿菌存在著多態(tài)性的進化標識物,如插入序列、SNP等,各自有著不同的進化速度。所以,基于不同分子鐘的進化研究常得出不同的結(jié)論。如:Hughes等[23]認為 H37Rv和CDC1551的共同祖先可能有著3.4萬~3.8萬年的歷史。但Kapur等[24]認為結(jié)核分枝桿菌約有1.5萬年的歷史。Smith等[25]認為應用分子鐘最重要的是區(qū)分突變、多態(tài)性和置換的概念。在最近的共同祖先出現(xiàn)之前,結(jié)核分枝桿菌已感染人類千百年,甚至更長時間,但是一些古老譜系已從現(xiàn)代種群中消失,因此分子水平的年代推定并不能夠提示結(jié)核分枝桿菌與人類共同進化的時間。
4.3 三大基因群的劃分 Sreevatsan等[2]進行的基于katG463和gyrA95兩個管家基因SNP情況的進化研究是結(jié)核分枝桿菌較為重要的進化研究之一。這項研究將MTBC劃分為3大基因群:group1、2和3。其中,group1中除了包括部分結(jié)核分枝桿菌外,還包括了牛分枝桿菌、田鼠分枝桿菌和非洲分枝桿菌。Sreevatsan等[2]認為group1內(nèi)的菌株與group2和3內(nèi)的菌株相比具有更高水平的基因變異,可能經(jīng)歷了更長時間的進化過程,即更為古老。
4.4 六大SNP聚集群(SNP cluster groups,SCGs)的劃分 Filliol等[16]基于SNP的分析,將結(jié)核分枝桿菌分為六大SNP聚集群即SCG-1、SCG-2、SCG-3、SCG-4、SCG-5和 SCG-6六大深支,并將SCG-3和 SCG-6進一步劃分為 SCG-3a、SCG-3b、SCG-3c、SCG-6a和SCG-6b五個亞群。這一結(jié)果有力地支持了Sreevatsan等人提出的3大基因群的觀點。Spoligotyping分型確定的主要基因型的分布情況如下:EAI基因型主要分布于SCG-1;Beijing基因型主要分布于SCG-2;CAS(Central Asian)基因型部分分布于SCG-3a;X基因型主要分布于SCG-3c和SCG-4。
近年來國內(nèi)外已經(jīng)開展了許多有關(guān)結(jié)核分枝桿菌及MTBC分子進化方面的研究。在結(jié)核分枝桿菌分子標識的進化方式、菌株進化模式和種群劃分等方面取得了不俗的研究成果。通過這些研究不僅使我們了解了不同結(jié)核分枝桿菌菌株間毒力差異機制,為抗結(jié)核藥物和疫苗的研發(fā)提供了理論支持;在流行病學方面,也提供了傳播模式和感染模式的信息,為結(jié)核病預防、控制策略的制定與實施提供了重要參考。盡管如此,尋求更為穩(wěn)定的進化標識、高致病性菌株北京基因型的溯源、毒力進化研究、進化與免疫機制關(guān)聯(lián)研究都是我們未來需要努力的方向。
[1]王睿,李聰然,梁蓓蓓,等.非結(jié)核分枝桿菌感染特點與藥物選擇研究進展[J].國際呼吸雜志,2006,26(4):280-282.
[2]Sreevatsan S,Pan X,Stockbauer KE,et al.Restricted structural gene polymorphism in the Mycobacterium tuberculosis complex indicates evolutionarily recent global dissemination[J].Proc Natl Acad Sci U S A,1997,94(18):9869-9874.
[3]Gutacker MM,Smoot JC,Migliaccio CA,et al.Genome-wide analysis of synonymous single nucleotide polymorphisms in Mycobacterium tuberculosis complex organisms:resolution of genetic relationships among closely related microbial strains[J].Genetics,2002,162(4):1533-1543.
[4]Brosch R,Gordon SV,Marmiesse M,et al.A new evolutionary scenario for the Mycobacterium tuberculosis complex[J].Proc Natl Acad Sci U S A,2002,99(6):3684-3689.
[5]Cole ST.Learning from the genome sequence of Mycobacterium tuberculosis H37Rv[J].FEBS Lett,1999,452(1-2):7-10.
[6]Fabre M,Koeck JL,Le Fleche P,et al.High genetic diversity revealed by variable-number tandem repeat genotyping and analysis of hsp65gene polymorphism in a large collection of"Mycobacterium canettii"strains indicates that the M.tuberculosis complex is a recently emerged clone of"M.canettii"[J].J Clin Microbiol,2004,42(7):3248-3255.
[7]Gutierrez MC,Brisse S,Brosch R,et al.Ancient origin and gene mosaicism of the progenitor of Mycobacterium tuberculosis[J].PLoS Pathog,2005,1(1):e5.
[8]Thierry D,Brisson-Noel A,Vincent-Levy-Frebault V,et al.Characterization of a Mycobacterium tuberculosis insertion sequence,IS6110,and its application in diagnosis[J].J Clin Microbiol,1990,28(12):2668-2673.
[9]Fang Z,Morrison N,Watt B,et al.IS6110transposition and evolutionary scenario of the direct repeat locus in a group of closely related Mycobacterium tuberculosis strains[J].J Bacteriol,1998,180(8):2102-2109.
[10]McEvoy CR,F(xiàn)almer AA,Gey van Pittius NC,et al.The role of IS6110in the evolution of Mycobacterium tuberculosis[J].Tuberculosis(Edinb),2007,87(5):393-404.
[11]Alland D,Lacher DW,Hazbon MH,et al.Role of large sequence polymorphisms(LSPs)in generating genomic diversity among clinical isolates of Mycobacterium tuberculosis and the utility of LSPs in phylogenetic analysis[J].J Clin Microbiol,2007,45(1):39-46.
[12]Fleischmann RD,Alland D,Eisen JA,et al.Whole-genome comparison of Mycobacterium tuberculosis clinical and laboratory strains[J].J Bacteriol,2002,184(19):5479-5490.
[13]van Embden JD,van Gorkom T,Kremer K,et al.Genetic variation and evolutionary origin of the direct repeat locus of Mycobacterium tuberculosis complex bacteria[J].J Bacteriol,2000,182(9):2393-2401.
[14]Supply P,Mazars E,Lesjean S,et al.Variable human minisatellite-like regions in the Mycobacterium tuberculosis genome[J].Mol Microbiol,2000,36(3):762-771.
[15]Smittipat N,Billamas P,Palittapongarnpim M,et al.Polymorphism of variable-number tandem repeats at multiple loci in Mycobacterium tuberculosis[J].J Clin Microbiol,2005,43(10):5034-5043.
[16]Filliol I,Motiwala AS,Cavatore M,et al.Global phylogeny of Mycobacterium tuberculosis based on single nucleotide polymorphism (SNP)analysis:insights into tuberculosis evolution,phylogenetic accuracy of other DNA fingerprinting systems,and recommendations for a minimal standard SNP set[J].J Bacteriol,2006,188(2):759-772.
[17]Gutacker MM,Mathema B,Soini H,et al.Single-nucleotide polymorphism-based population genetic analysis of Mycobacterium tuberculosis strains from 4geographic sites[J].J Infect Dis,2006,193(1):121-128.
[18]Arnold C,Thorne N,Underwood A,et al.Evolution of short sequence repeats in Mycobacterium tuberculosis[J].FEMS Microbiol Lett,2006,256(2):340-346.
[19]Thorne N,Borrell S,Evans J,et al.IS6110-based global phylogeny of Mycobacterium tuberculosis[J].Infect Genet Evol,2011,11(1):132-138.
[20]Thorne N,Evans JT,Smith EG,et al.An IS6110-targeting fluorescent amplified fragment length polymorphism alternative to IS6110restriction fragment length polymorphism analysis for Mycobacterium tuberculosis DNA fingerprinting[J].Clin Microbiol Infect,2007,13(10):964-970.
[21]Stead WW.The origin and erratic global spread of tuberculosis.How the past explains the present and is the key to the future[J].Clin Chest Med,1997,18(1):65-77.
[22]Gordon SV,Brosch R,Billault A,et al.Identification of variable regions in the genomes of tubercle bacilli using bacterial artificial chromosome arrays[J].Mol Microbiol,1999,32(3):643-655.
[23]Hughes AL,F(xiàn)riedman R,Murray M.Genomewide pattern of synonymous nucleotide substitution in two complete genomes of Mycobacterium tuberculosis[J].Emerg Infect Dis,2002,8(11):1342-1346.
[24]Kapur V,Whittam TS,Musser JM.Is Mycobacterium tuberculosis 15,000years old?[J].J Infect Dis,1994,170(5):1348-1349.
[25]Smith NH,Hewinson RG,Kremer K,et al.Myths and misconceptions:the origin and evolution of Mycobacterium tuberculosis[J].Nat Rev Microbiol,2009,7(7):537-544.