楊鵬鵬, 羅娟秀, 宋玉竹, 李曉非, 夏雪山*, 張阿梅*
(1)昆明理工大學(xué) 生命科學(xué)與技術(shù)學(xué)院 分子病毒實(shí)驗(yàn)室,昆明 650500;2)昆明市第三人民醫(yī)院,臨床檢驗(yàn)科,昆明 650041)
結(jié)核病(tuberculosis,TB)是由結(jié)核分枝桿菌(Mycobacteriumtuberculosis,MTB)引起的傳染性疾病,也是單一病原菌感染導(dǎo)致死亡的首位原因。2018年,全球約1/4人口感染了結(jié)核分枝桿菌,大約1 000萬人(從900萬到1 110萬不等)發(fā)展為活動(dòng)性結(jié)核病[1]。盡管多種抗結(jié)核藥物已在臨床上大量應(yīng)用,但一線抗結(jié)核藥物仍是主要治療藥物。然而抗結(jié)核藥物的廣泛使用帶來了不可忽視的問題,例如耐藥結(jié)核(drug-resistant TB,DR-TB)患者的增加。2018年,有484 000例結(jié)核病患者被診斷為利福平耐藥結(jié)核病(rifampicin-resistant TB,RR-TB),78%的RR-TB患者屬于耐多藥結(jié)核病(multidrug-resistant TB,MDR-TB)患者。印度(27%)、中國(guó)(14%)和俄羅斯聯(lián)邦(9%)的耐藥結(jié)核患者約占全球耐藥結(jié)核患者的一半[2]。據(jù)統(tǒng)計(jì),2018年只有139 114例MDR-TB患者得到了有效的診斷和治療[2]。而未被及時(shí)診斷和治療的耐藥患者中有43%存在于印度或中國(guó),因此,對(duì)一線耐藥結(jié)核患者進(jìn)行快速準(zhǔn)確的診斷是提高治愈率和降低死亡率的有效措施之一[2]。
及時(shí)準(zhǔn)確的診斷是成功治療的關(guān)鍵,但是臨床應(yīng)用的診斷技術(shù)和方法仍然存在一些問題[3-4]。藥物敏感性試驗(yàn)(drug-susceptibility testing,DST)是判斷耐藥結(jié)核菌株的金標(biāo)準(zhǔn),但該技術(shù)存在操作復(fù)雜、培養(yǎng)時(shí)間長(zhǎng)等缺點(diǎn)[5]。分子診斷是目前常用的臨床診斷方法之一,也是控制耐藥結(jié)核病流行、傳播和治療的關(guān)鍵因素之一[6]??梢允褂靡淮鷾y(cè)序方法來鑒定耐藥基因的突變,但它的缺點(diǎn)是通量較低且價(jià)格昂貴[7-8]。中等通量方法,例如基因芯片,但其在提高檢測(cè)速度的同時(shí)卻降低了準(zhǔn)確性和靈敏度[9-10]?;诙鷾y(cè)序技術(shù)發(fā)展的擴(kuò)增子測(cè)序是一種高通量、靈敏且準(zhǔn)確的檢測(cè)方法。目前,二代測(cè)序技術(shù)已被廣泛用于診斷疾病、研究病因和致病機(jī)制等方面[11-13],但在耐藥結(jié)核菌的突變檢測(cè)中應(yīng)用較少。
本文建立了一種快速、準(zhǔn)確、靈敏且覆蓋范圍廣的擴(kuò)增子測(cè)序方法,用以篩選結(jié)核耐藥菌株的17個(gè)一線耐藥基因的突變。
由昆明市第三人民醫(yī)院檢驗(yàn)科的醫(yī)生使用羅氏培養(yǎng)基培養(yǎng)26個(gè)臨床結(jié)核分枝桿菌菌株,1個(gè)對(duì)藥物敏感的結(jié)核分枝桿菌臨床分離菌株作為陰性對(duì)照。使用一線抗結(jié)核藥物和相對(duì)應(yīng)的濃度對(duì)所有收集的結(jié)核菌株進(jìn)行藥物敏感性檢測(cè):異煙肼(0.2 mg/L);利福平(40 mg/L);鏈霉素(4.0 mg/L);乙胺丁醇(2.0 mg/L);吡嗪酰胺(100 mg/L)。該研究得到昆明理工大學(xué)醫(yī)學(xué)倫理委員會(huì)的批準(zhǔn)。
用G +細(xì)菌基因組DNA小量提取試劑盒(莊盟生物,中國(guó))提取結(jié)核分枝桿菌菌株的基因組DNA。根據(jù)結(jié)核分枝桿菌菌株H37Rv的基因組序列設(shè)計(jì)引物(GenBank登錄號(hào):CP003248.2)。共設(shè)計(jì)了16對(duì)引物,用于擴(kuò)增5種一線抗結(jié)核藥物的17種耐藥基因??巩悷熾碌幕虬╧atG、sigI、ahpC、oxyR、kasA、ndh、nat和mshA基因;抗利福平的基因包括rpoA、rpoB和rpoC基因;抗乙胺丁醇的基因包括embA、embB和embC基因;抗吡嗪酰胺的基因包括pncA和rpsA基因;抗鏈霉素的基因?yàn)閞psL基因。擴(kuò)增引物見Table2。
PCR反應(yīng)體系為50 μL,其中包含25 μL 2×Phanta?Turbo Master Mix(Vazyme,中國(guó)),30 ng 結(jié)核分枝桿菌基因組DNA和0.2 μL正向/反向引物。PCR條件如下:95 ℃預(yù)變性3 min,95 ℃變性15 s,65 ℃退火15 s,72 ℃延伸(延伸時(shí)間見Table 1),重復(fù)35個(gè)循環(huán),72 ℃延伸5 min。通過使用瓊脂糖凝膠DNA回收試劑盒(TIANGEN,中國(guó))純化擴(kuò)增產(chǎn)物。
Table 1 The information of target fragment amplification primers and barcode evaluation
1.3.1 構(gòu)建擴(kuò)增子文庫 根據(jù)說明書,使用Ion XpressTMPlus Fragment Library Kit(Thermo Fisher Scientific,美國(guó))將PCR擴(kuò)增子構(gòu)建到文庫中。使用Qubit?dsDNA HS Assay Kit(Thermo Fisher Scientific,美國(guó)),將每個(gè)文庫的濃度歸一化至100 pmol/L,以進(jìn)行下一步研究。
1.3.2 乳液PCR 根據(jù)Ion PGMTMTemplate OT2 Reactions 400 Kit(Thermo Fisher Scientific,美國(guó))的說明書,在Ion OneTouchTM2 Instrument上初始化擴(kuò)增子。再使用文庫DNA模板進(jìn)行乳液PCR。通過使用Ion OneTouchTMES(Life Technologies,美國(guó))富集乳液PCR擴(kuò)增子。
1.3.3 Ion TorrenTM PGM 測(cè)序 使用Ion 314TMChip Kit v2和Ion Personal Genome Machine?(PGMTM)System(Life Technology,美國(guó))對(duì)富集的乳液PCR擴(kuò)增子進(jìn)行測(cè)序。
用Ion Torrent Variant Caller軟件分析測(cè)序結(jié)果,首先刪除了低質(zhì)量的(<50個(gè)reads)或潛在錯(cuò)誤的數(shù)據(jù)。所有測(cè)定序列以H37Rv菌株作為參考序列進(jìn)行分析。通過一代測(cè)序進(jìn)一步驗(yàn)證了由二代測(cè)序鑒定出的突變,并在數(shù)據(jù)庫(https://tbdreamdb.ki.se/Info/)中檢索檢測(cè)到的突變,初步分析這些突變是否已被報(bào)道。對(duì)檢測(cè)到的新突變?cè)?種分枝桿菌中進(jìn)行保守性分析:結(jié)核分枝桿菌、非洲分枝桿菌、亞洲分枝桿菌、鳥分枝桿菌、牛分枝桿菌、卡氏分枝桿菌、胃分枝桿菌、堪薩斯分枝桿菌和猿分枝桿菌。從GenBank下載參考序列進(jìn)行突變的保守性分析:WP_036362533.1、WP_003876960.1、WP_015294659.1、ORV60366.1、WP_023368850.1、KAA1250968.1、AMQ40394.1、KFW49971.1和NP_218311.1 用于分析embA基因;WP_051545718.1、WP_062908845.1、WP_015304020.1、WP_036411168.1、WP_152343010.1、KAA1250969.1、PRI02116.1、ALE45293.1和NP_218312.1用于分析embB基因;YP_009361183.1、WP_036362533.1、WP_010948786.1、WP_015304018.1、WP_036411191.1、WP_023368851.1、KAA1250966.1、NP_218310.1和KBF93337.1用于分析embC基因;NP_216424.1、CAA58266.1、WP_036359980.1、WP_019733604.1、WP_015290248.1、WP_036416255.1、WP_023364424.1、WP_044506092.1和KBI31267.1 用于分析katG基因;OBK93179.1、AYJ06713.1、ORV80661.1、EP43955.1、ORJ60792.1、NP_217974.1、AMQ40106.1、PHO98980.1和CCK65673.1用于分析rpoA基因;WP_051544984.1、WP_121035721.1、WP_015292360.1、WP_084293527.1、KEP43840.1、WP_084949953.1、NP_215181.1、AMQ37657.1和AKO23650.1用于分析rpoB基因;NP_215182.1、WP_036352589.1、WP_062899648.1、WP_014000349.1、ORV79512.1、ORB85546.1、ORJ60893.1、PRH95962.1和YP_009358020.1用于分析rpoC基因;WP_036355980.1、AYJ04498.1、WP_015303118.1、ORV74789.1、KZS77521.1、ORJ57881.1、NP_216146.1、PRH99054.1和KFW56032.1用于分析rpsA基因。用SWISS-MODEL(https://swissmodel.expasy.org/)預(yù)測(cè)蛋白質(zhì)的局部結(jié)構(gòu)是否發(fā)生變化。
通過藥物敏感性實(shí)驗(yàn)將26株臨床菌株確認(rèn)為耐藥結(jié)核菌株,包括11株單耐藥菌株和15株多耐藥菌株。單耐藥菌株分別為:5株吡嗪酰胺耐藥株(45.5%),4株利福平耐藥株(36.4%),乙胺丁醇和鏈霉素耐藥株各1株,未發(fā)現(xiàn)針對(duì)異煙肼的單耐藥菌株。26株臨床耐藥結(jié)核株中,耐異煙肼、利福平、鏈霉素、乙胺丁醇和吡嗪酰胺的比例分別為53.8%(14/26),61.5%(16/26),50.0%(13/26),26.9%(7/26)和 46.2%(12/26)(Table 2)。
Table 2 Summary of DST results and mutations of each sample
每張Ion 314TM芯片可以檢測(cè)10株結(jié)核分枝桿菌臨床株。每張芯片最終獲得71.1 M數(shù)據(jù),覆蓋率達(dá)到70%(Fig.1A),負(fù)荷率為49%(Fig.1B)。共獲得622 597個(gè)reads。篩除無模板的reads(占總reads的1%),多克隆reads(占總reads的19%),低質(zhì)量reads(占總reads的14%),測(cè)試片段(占總reads的9%)和銜接子二聚體reads(占總reads的1%),有效reads的數(shù)目為376 086。有效reads的擴(kuò)增長(zhǎng)度在100 bp至300 bp之間,平均長(zhǎng)度為189 bp(Fig.1C)。67.6 M數(shù)據(jù)(約97%)成功匹配,平均覆蓋深度為1 565.7X(Fig.1D)。當(dāng)平均讀取長(zhǎng)度為1X時(shí),精度達(dá)到99.2%(Fig.1E)。
Fig.1 Report of the Ion PGMTM System (A)Total bases and ISP density;(B)Total reads and ISP summary;(C)Read length;(D)Total alignment bases and average coverage depth;(E)Mean raw accuracy
僅在10個(gè)基因(包括katG、rpoA、rpoB、rpoC、embA、embB、embC、pncA、rpsA和rpsL基因)中檢測(cè)到耐藥突變的存在,共鑒定出65個(gè)突變位點(diǎn),所有突變均經(jīng)過一代測(cè)序驗(yàn)證,新發(fā)現(xiàn)的突變測(cè)序圖見Fig.2,另外7個(gè)基因(kasA、mshA、nat、oxyR-ahpC、sigI和ndh基因)中未檢測(cè)到突變。檢測(cè)到的65個(gè)突變可分為38種類型,其中熱點(diǎn)突變占總突變的50.8%(33/65),包括embB基因的c.916A>T/G和c.918G>A,katG的c.944G>C和c.1388G>T,rpoB基因的c.1592C>T,rpsL基因的c.128A>G和c.263A>G。9個(gè)稀有突變分別為embA基因的c.-12C>T,embB基因c.3070G>A,katG基因的c.1388G>A和c505G>A,rpoC基因的c.1448T>A、c.-12T>C、c.-7T> C和c.211C> T,pncA基因的c.233G> A。
Fig.2 Sanger sequencing peak map of newly discovered mutation sites The mutation sites identified by the red characters are complementary to the reference sequence due to the use of reverse primers for sequencing
與結(jié)核病耐藥抗性突變數(shù)據(jù)庫檢索對(duì)比后,發(fā)現(xiàn)23個(gè)檢測(cè)到的突變未被報(bào)道,分屬于21個(gè)突變類型。新突變分別為embA基因的c.2853G>T和c.250G>T,embB基因的c.1091T>C、c.1687A>C、c.2018T>C、c.2035G>A和c.3005A>G,embC基因的c.1873G>T、c.1991C>A和c.2920G>T,katG基因的c.2111T>C,rpoA基因的c.544C>T和c.1009G>A,ropB基因的c.-6T>C和c.238T>C,rpoC基因的c.1247A>G、c.1450T>G和c.2829C>A,rpsA基因的c.-55C>A,c.-132G> A和c.193G>A。
在5個(gè)臨床耐藥結(jié)核菌株(包括3個(gè)單耐藥菌株和2個(gè)耐多藥菌株)中未檢測(cè)到任何突變,在9個(gè)結(jié)核菌株中發(fā)現(xiàn)了同一耐藥基因的2個(gè)共存突變(Table 2),分別存在于katG(5個(gè))、embB(2個(gè))、rpoB(1個(gè))和pncA基因(1個(gè))。katG基因的所有5個(gè)共存突變中均包含突變c.1388G>T。突變數(shù)量最多的菌株(樣品#535)中共檢測(cè)到10個(gè)耐藥突變。
保守性分析結(jié)果顯示14個(gè)新突變具有高度保守性(Fig.3),分別是embA基因的p.A84S(c.250G>T)和p.E951D(c.2853G>T);embB基因的p.L364P(c.1091T>C)、p.I563L(c.1687A>C)、p.A679T(c.2035G>A)、p.V727A(c.2018T>C)和p.H1002R(c.3005A>G);katG基因的p.L704S(c.2111T>C);rpsA基因的p.A65T(c.193G>A);rpoA基因的p.R182W(c.544C>T)和p.D337N(c.1009G>A);rpoC基因的p.N416S(c.1247A>G)、p.W484G(c.1450T>G)和p.D943E(c.2829C>A)。用SWISS-MODEL對(duì)這些保守突變的結(jié)構(gòu)進(jìn)行預(yù)測(cè)(Fig.4)。結(jié)果表明,除rpoA基因的突變p.D337N(該突變未能準(zhǔn)確預(yù)測(cè)),所有錯(cuò)義突變均導(dǎo)致氨基酸發(fā)生改變,進(jìn)而改變蛋白質(zhì)的空間結(jié)構(gòu),因此這些突變可能導(dǎo)致其蛋白質(zhì)功能的改變。
Fig.3 Evolutionary conservation analysis of the amino acid changes with eighteen novel missense mutations Nine Mycobacterium species(Mycobacterium tuberculosis, Mycobacterium africanum, Mycobacterium asiaticum, Mycobacterium avium, Mycobacterium bovis, Mycobacterium canettii, Mycobacterium gastri, Mycobacterium kansasii, and Mycobacterium simiae)were used in this analysis
Fig.4 Partial structures prediction with missense mutation of 13 conserved mutations (A)Partial structure predictions with missense mutations in the embA gene;(B)Partial structure predictions with missense mutations in the katG gene;(C)Partial structure predictions with missense mutations in the embB gene;(D)Partial structure predictions with missense mutations in the rpsA gene;(E)Partial structure predictions with missense mutations in the rpoA gene;(F)Partial structure predictions with missense mutations in the rpoC gene
耐藥結(jié)核病是亟待解決嚴(yán)重的社會(huì)和健康問題之一,對(duì)耐藥結(jié)核病患者的快速準(zhǔn)確診斷在標(biāo)準(zhǔn)化治療中發(fā)揮重要作用[14]。目前檢測(cè)耐藥結(jié)核菌株的技術(shù)分為基于表型和基因型的檢測(cè)方法[15-16]。盡管基于表型的藥物敏感性實(shí)驗(yàn)是診斷耐藥結(jié)核的“金標(biāo)準(zhǔn)”,但由于其實(shí)驗(yàn)條件嚴(yán)苛、耗費(fèi)時(shí)間長(zhǎng)、易污染等缺點(diǎn),臨床上應(yīng)用效果不盡理想。分子診斷方法已廣泛用于臨床和實(shí)驗(yàn)室中檢測(cè)結(jié)核菌的耐藥突變,主要包括TaqMan探針法,Gene Xpert MTB/RIF 和基因芯片等[17-20]。但是,這些分子檢測(cè)方法主要檢測(cè)熱點(diǎn)耐藥基因的熱點(diǎn)突變區(qū)域,導(dǎo)致一些稀有突變或新突變不能被發(fā)現(xiàn),從而延誤耐藥結(jié)核患者的治療。因此通過擴(kuò)增一線抗結(jié)核藥物相關(guān)所有基因進(jìn)行測(cè)序分析,才能解決無法檢測(cè)到稀有突變和新突變位點(diǎn)的問題。Sanger 測(cè)序法具有測(cè)定序列較長(zhǎng)和準(zhǔn)確性高等優(yōu)點(diǎn),曾在人類基因組計(jì)劃中發(fā)揮了關(guān)鍵的作用,并應(yīng)用于腫瘤學(xué)、遺傳學(xué)和微生物學(xué)等多種學(xué)科的研究。但其檢測(cè)成本高,檢測(cè)通量低,無法滿足大規(guī)模測(cè)序的需求。二代測(cè)序降低了檢測(cè)成本,在保證準(zhǔn)確性的同時(shí)縮短測(cè)序時(shí)間,因此已廣泛的應(yīng)用于全基因組分析、外顯子組分析、轉(zhuǎn)錄組分析、宏基因組分析和基因分型等方面[21]。本文構(gòu)建了擴(kuò)增子測(cè)序的檢測(cè)方法,可同時(shí)檢測(cè)10株臨床結(jié)核菌株的17個(gè)一線耐藥基因。在26個(gè)耐藥結(jié)核菌株中檢測(cè)到21種新突變,這表明使用該方法可以有效地檢測(cè)到耐藥結(jié)核菌株的新突變,從而對(duì)臨床患者是否耐藥進(jìn)行診斷。此外,在7個(gè)選定的基因中均未發(fā)現(xiàn)突變,這表明熱點(diǎn)候選基因依然是結(jié)核菌的耐藥突變的重點(diǎn)檢測(cè)對(duì)象。
云南省耐藥結(jié)核菌株中,單耐藥結(jié)核和多耐藥結(jié)核分別占42.3%和57.7%。Hu等人[22]的研究中多耐藥結(jié)核病發(fā)生率為79.51%,明顯高于本研究中的多耐藥結(jié)核頻率(P= 0.036)。可能是人群差異和樣本量的不同導(dǎo)致多耐藥比例存在差異。而耐藥基因發(fā)生突變的頻率在我國(guó)不同地區(qū)同樣存在差異,這些差異可能是由于檢測(cè)方法的差異所致,本研究中耐藥基因突變頻率高于文獻(xiàn)報(bào)道的湖南省耐藥突變頻率[23]。這些結(jié)果提示,需要建立更全面的檢測(cè)方法以便發(fā)現(xiàn)更多的耐藥突變位點(diǎn)。
本研究中5個(gè)藥敏試驗(yàn)確定的表型耐藥菌株(包括3個(gè)單耐藥菌株和2個(gè)耐多藥菌株)未在17個(gè)耐藥基因中檢測(cè)到突變,而且一些表型耐藥菌株的藥敏試驗(yàn)結(jié)果和基因型不完全一致。該結(jié)果與一些報(bào)道具有相似性,Ko等人分析了36個(gè)表型耐藥菌株的8個(gè)耐藥相關(guān)基因,結(jié)果發(fā)現(xiàn),基因型與表型的耐藥分析不一致,不同耐藥基因發(fā)生突變對(duì)耐藥表型的預(yù)測(cè)值在44%~100%之間[24]。而辜吉秀等人的研究中耐藥基因突變對(duì)耐藥表型的預(yù)測(cè)值在54.55%~100%之間[25]。由此可見,耐藥突變的基因型與表型之間存在一定的差異,且不同藥物的差異度存在較大區(qū)別,可能是由以下原因引起這種差異:(1)耐藥菌株中可能存在一些未被發(fā)現(xiàn)的耐藥基因;(2)已知的針對(duì)某種藥物的耐藥基因突變也影響了其他藥物的耐藥性;(3)盡管在治療藥物相對(duì)應(yīng)的耐藥基因中未發(fā)現(xiàn)突變,但其他耐藥基因突變的協(xié)同作用可能是多耐藥的原因。本研究檢測(cè)的120號(hào)菌株中,未在已知的17個(gè)耐藥基因中檢測(cè)到耐藥突變,這一結(jié)果也提示以上推測(cè)的可能性。這些推測(cè)是否可以解釋耐藥菌株表型和基因型之間的矛盾結(jié)果,需要進(jìn)一步研究。
總之,本研究構(gòu)建了一種基于二代測(cè)序技術(shù)的擴(kuò)增子測(cè)序方法,用以篩選已知一線抗結(jié)核藥物耐藥基因的所有潛在突變,該方法有望用于臨床,為耐藥結(jié)核患者的臨床快速準(zhǔn)確診斷和有效治療提供技術(shù)依據(jù)。