郭九標,張惠華,蔡 毅,楊倩婷,陳 騎,楊 帆,張明霞,鄧國防,陳心春
(1.廣東省組織器官區(qū)域免疫與疾病重點實驗室,深圳大學(xué)基礎(chǔ)醫(yī)學(xué)院病原生物學(xué)系,廣東 深圳 518052;2.深圳市第三人民醫(yī)院,廣東 深圳 518112)
結(jié)核?。═uberculosis,TB)是由單一病原菌結(jié)核分枝桿菌(Mycobacterium tuberculosis,Mtb)感染導(dǎo)致的傳染性疾病,是全球十大死因之一[1-2]。作為一種古老的疾病,TB雖然不會像新型冠狀病毒肺炎那樣在短期內(nèi)造成全球性的災(zāi)難大流行,但仍然是人類健康的一個威脅。世界衛(wèi)生組織(World Health Organization,WHO)最新統(tǒng)計數(shù)據(jù)顯示,2019年全球新增890~1 100萬例TB患者,死亡約140萬例[1]。結(jié)核的早期感染無明顯臨床癥狀,且卡介苗(bacille Calmette-Guérin,BCG)的保護效果欠佳,而短期內(nèi)新疫苗/藥物的研發(fā)也更難以實現(xiàn)突破。鑒于此,尋找和開發(fā)一種能夠早期、快速、準確的診斷結(jié)核病的生物標記物或方法,對早期預(yù)防、控制、治療具有重大意義。
目前,臨床上結(jié)核病診斷技術(shù)主要分為三大類:病原學(xué)診斷、免疫學(xué)診斷及影像學(xué)診斷[3]。在病原學(xué)診斷方面,痰涂片和痰培養(yǎng)技術(shù)是傳統(tǒng)的金標準,但該技術(shù)具有敏感性低和周期長等缺點,而且約50%的患者找不到結(jié)核病診斷的病原學(xué)依據(jù)。GeneXpert是近年來發(fā)展起來的基于分子生物學(xué)的技術(shù),盡管能夠?qū)崿F(xiàn)對結(jié)核菌的快速分子診斷和耐藥檢測,但價格昂貴、需要專用設(shè)備和試劑以及不適用于大規(guī)模人群主動篩查等制約因素限制了其發(fā)展和應(yīng)用[4]。在免疫學(xué)診斷方面,結(jié)核特異性γ干擾素釋放試驗(interferon-γrelease assay,IGRA)近年來有較快速的發(fā)展,具有良好的特異性和敏感性,但不能有效的區(qū)分活動性結(jié)核(active tuberculo?sis,ATB)和潛伏感染(latent tuberculosis infection,LTBI)[5]。在影像學(xué)診斷以及基于人工智能(artifi?cial intelligence,AI)的結(jié)核影像診斷技術(shù)方面,盡管該技術(shù)也獲得了廣泛的關(guān)注并且具有很好的發(fā)展前景,但尚需更多的臨床驗證和試驗數(shù)據(jù)證明。而隨著高通量測序技術(shù)的快速發(fā)展,其也越來越多地被應(yīng)用到了結(jié)核病的快速診斷領(lǐng)域。SWEENEY TE及同事基于對14個數(shù)據(jù)庫中的2 572個樣品的薈萃分析并在臨床樣本中驗證后發(fā)現(xiàn),GBP5、DUSP3和KLF2的三基因組合能夠很好地區(qū)分活動性結(jié)核(AUC為0.90)[6]。我們前期對健康對照(health con?trol,HC)、LTBI和ATB患者外周血單核細胞(periph?eral blood mononuclear cells,PBMC)中全基因轉(zhuǎn)錄組進行系統(tǒng)分析發(fā)現(xiàn),TB患者有77個高表達和50個低表達的差異表達基因,其中有12個差異表達基因在經(jīng)抗結(jié)核治療后顯著下調(diào);并且進一步分析發(fā)現(xiàn),其中有8個基因的組合能夠很好地用于區(qū)分結(jié)核[7]。
本研究在前期研究的基礎(chǔ)上,進一步在外周血樣本中對比分析了其中有潛力的、能夠用來區(qū)分結(jié)核的基因,并開發(fā)了單管同步檢測3個基因的實時熒光PCR技術(shù),用于臨床上快速診斷結(jié)核患者。
1.1 樣本來源回顧性研究2019年8月至11月于深圳市第三人民醫(yī)院住院的TB患者250例、非結(jié)核樣本(Non-TB)380例。樣本分為三組數(shù)據(jù)集:第一組共247例,包括59例TB與188例Non-TB,用于SYBR Green檢測20個基因表達情況;第二組共315例,包括158例TB與157例Non-TB,用于模型訓(xùn)練;第三組共68例,包括33例TB與35例Non-TB,用于模型獨立測試。本研究所使用的病例經(jīng)醫(yī)院醫(yī)學(xué)倫理委員會審核批準并取得所有患者知情同意并簽署同意書。實驗設(shè)計流程參考圖1。
圖1 本研究實驗設(shè)計和樣本統(tǒng)計
患者診斷根據(jù)中華醫(yī)學(xué)會結(jié)核分會制定的《肺結(jié)核診斷和治療指南》標準。入組標準:(1)TB:年齡在18~65周歲;初次診斷為肺結(jié)核病并且尚未接受抗結(jié)核治療。(2)Non-TB:包括HC、肺炎患者(pneumonia,PN)和已治愈肺結(jié)核患者(cured TB,RxTB)。其中,HC:結(jié)核菌特異性γ干擾素ELISPOT檢測陰性;無結(jié)核臨床表現(xiàn)(胸部放射學(xué)檢查無異常)。PN:結(jié)核菌涂片和培養(yǎng)均為陰性,細菌學(xué)檢測證實有結(jié)核菌之外細菌或真菌,結(jié)合臨床癥狀、影像學(xué)及治療性診斷等不支持結(jié)核菌的診斷。RxTB:完成治療時間>2年,并且沒有復(fù)發(fā)。上述入組人群均排除合并其他傳染病、慢性疾病及自身免疫疾病、妊娠等。
1.2 實驗方法
1.2.1 樣本采集及處理使用肝素抗凝劑管抽取研究對象清晨空腹靜脈血5 mL。
1.2.2 分離提取PBMC與提取總RNA使用Ficoll淋巴分離液以1∶1∶1的比例(5 mL全血標本:5 mL 1×PBS:5 mL淋巴分離液)分離提取PBMC。并按照Trizol試劑盒(Invitrogen)說明書提取總RNA,具體操作流程為:加350μL TRK試劑重懸收集的PBMC,再加入350μL 70%的乙醇(DEPC水配制),充分混勻后轉(zhuǎn)移至特定分離柱中,10 000×g離心1 min;離心后棄去下層液體,添加500μL洗液Ⅰ試劑,10 000×g離心1 min;棄廢液再加500μL洗液Ⅱ試劑,10 000×g離心1 min,并重復(fù)2次,最高轉(zhuǎn)速空轉(zhuǎn)2 min,把分離柱轉(zhuǎn)到新的無RNase的1.5 mL EP管中,最后用50μL DEPC處理過的蒸餾水洗脫,最高轉(zhuǎn)數(shù)離心2 min。取1μL純化的RNA測定OD260/OD280吸光值,比值在1.8~2.1之間則表明核酸提取質(zhì)量較高,可以開展后續(xù)試驗。
1.2.3 逆轉(zhuǎn)錄取8μL上述提取的總RNA,利用逆轉(zhuǎn)錄試劑盒(HiScripⅡReverse Transcriptase)把總RNA轉(zhuǎn)錄成cDNA。去基因組DNA:在RNasefree離心管中配制混合液:模版RNA 8μL,4×gDNA wiper Mix 8μL,RNase-free ddH2O 16μL;輕輕吹打混勻,42℃2 min;逆轉(zhuǎn)錄:加入5×HiScripⅡqRT SuperMixⅡ8μL,輕輕吹打混勻,50℃15 min,85℃15 sec。保存于-80℃冰箱備用。
1.2.4 探針法實時熒光定量PCR(RT-qPCR)引物及對應(yīng)的探針序列參見表1。實驗儀器為ABI7500熒光定量PCR儀。反應(yīng)體系為20μL(2×qPCR probe master mix:10μL,特異性前、后向引物(10μM)各0.4μL,模版1μL,ROX Reference Dye 2試劑:0.4μL,probe 0.2μL,去離子水:7.6μL)。反應(yīng)條件:95℃預(yù)變性5 min,95℃變性10 s,60℃延伸30 s,40個循環(huán)。每個樣本設(shè)置3個復(fù)孔,以GAPDH基因作為內(nèi)參基因。SYBR green熒光染料法RT-qPCR的方法同上,但反應(yīng)體系中不添加探針,反應(yīng)條件為:95℃預(yù)變性5 min,95℃變性15 s,55℃復(fù)性34 s,72℃延伸34 s,40個循環(huán),溶解曲線為機器(ABI7500)默認(95℃15 s,60℃60 s,95℃15 s),最后72℃延伸10 min。
表1 本研究涉及到的4個基因(含內(nèi)參基因)的引物和對應(yīng)的探針序列
1.2.5 統(tǒng)計學(xué)分析特征篩選和診斷模型構(gòu)建采用R語言的caret包和pROC包,評價參數(shù)包括準確度、敏感性和特異性。特征選擇方法為支持向量機(support vector machine,SVM);診斷模型為NNET,模型構(gòu)建過程中劃分10-折交叉驗證并重復(fù)5遍[8]。各組間比較采用單因素方差分析,并用Bonferroni進行校正,以校正P值(q value)<0.05為差異有統(tǒng)計學(xué)意義。
2.1 篩選可區(qū)分結(jié)核和非結(jié)核的潛在差異基因組合我們前期的一項對9例治療前TB患者、12例Non-TB樣本(包括6例LTBI和6例HC)的全基因轉(zhuǎn)錄組學(xué)分析發(fā)現(xiàn),TB患者中有77個高表達、50個低表達的差異表達基因[7]。為了進一步篩選出可以區(qū)分TB和Non-TB的差異基因,我們挑選了其中20個有明顯差異表達的基因,并在59個TB和188個Non-TB樣本(包括66個HC、61個RxTB和61個PN)中利用SYBR green RT-qPCR技術(shù)進行了檢測。為了能用于Taqman單管同步檢測,我們將特征選擇數(shù)量限制在3個基因內(nèi)。通過SVM我們篩選出來CD157、GSDMD和VAMP5的三基因組合效果最好。其準確度、靈敏度和特異性分別為0.84(95%CI:0.79,0.88)、0.85(95%CI:0.79,0.89)和0.81(95%CI:0.69,0.90)(圖2)。
圖2 利用SVM特征選擇選取三基因組合的診斷效果統(tǒng)計
2.2 CD157、GSDMD和VAMP5在結(jié)核患者中呈差異表達趨勢為了進一步評估CD157、GSDMD和VAMP5用于區(qū)分和診斷結(jié)核的效果,我們在上述人群中分別比較了這3個基因的表達差異性(圖3)。結(jié)果發(fā)現(xiàn),與HC相比,TB患者中的CD157、GSDMD和VAMP5基因都呈差異表達趨勢(圖3),其中CD157的表達具有顯著性差異(圖3A);另外,我們的數(shù)據(jù)還顯示與RxTB和PN相比,TB患者中的CD157、GSDMD和VAMP5基因的表達都呈顯著下降趨勢。這些數(shù)據(jù)提示CD157、GSDMD和VAMP5三基因可能具有區(qū)分和診斷結(jié)核以及衡量評價結(jié)核治療效果的潛力。
圖3 CD157(A)、GSDMD(B)和VAMP5(C)在不同人群中的差異表達情況
2.3 CD157、GSDMD和VAMP5基因的表達具有很好的穩(wěn)定性和重復(fù)性考慮到后期擬開發(fā)的探針法RT-qPCR技術(shù),在后續(xù)研究中,我們采用了Taqman RT-qPCR技術(shù)。為了檢驗CD157、GSDMD和VAMP5基因表達的穩(wěn)定性和重復(fù)性,我們隨機選取了100份外周血PBMC,并將每一個樣品平分為2份,1份凍存于-80℃冰箱1周作為凍存樣品,1份作為新鮮樣品,然后分別提取總RNA并進行RT-qPCR分析。結(jié)果發(fā)現(xiàn),樣品凍存與否對CD157、GSDMD和VAMP5基因的表達沒有顯著性差異(圖4),并且這3個基因的CV值分別為0.05、0.01和0.02,顯示出單管同步檢測技術(shù)具有很好的穩(wěn)定性和重復(fù)性。
圖4 CD157(A)、GSDMD(B)和VAMP5(C)基因表達的穩(wěn)定性和重復(fù)性分析Fresh,新鮮外周血PBMC;Frozen,凍存外周血PBMC。ns,沒有統(tǒng)計學(xué)差異。
2.4基于CD157、GSDMD和VAMP5三基因組合的NNET模型用于區(qū)分和診斷結(jié)核為了測試和評估CD157、GSDMD和VAMP5基因組合用于區(qū)分和診斷結(jié)核的效果,我們重新收集了兩批樣本。第一批315樣本(TB病例158例,Non-TB樣本157例)作為訓(xùn)練集構(gòu)建NNET模型;并以第二批獨立樣本(TB病例33例,Non-TB樣本35例)作為測試集對模型進行測試,用于評估模型的區(qū)分效能。結(jié)果顯示,訓(xùn)練集的AUC面積為0.85(95%CI:0.80,0.89)(圖5A);其準確度、靈敏度與特異性分別為0.77(95%CI:0.72,0.82)、0.80(95%CI:0.72,0.86)和0.75(95%CI:0.68,0.82)(圖5B)。測試集的AUC面積為0.84(95%CI:0.80,0.89)(圖6A);其準確度、靈敏度與特異性分別為0.75(95%CI:0.63,0.85)、0.74(95%CI:0.57,0.88)和0.76(95%CI:0.58,0.89)(圖6B)。
圖5 NNET模型訓(xùn)練結(jié)果
圖6 NNET模型測試結(jié)果
隨著芯片技術(shù)與高通量測序技術(shù)的快速發(fā)展,更多的RNA表達譜被發(fā)現(xiàn)并廣泛運用于解釋其在人體內(nèi)導(dǎo)致或?qū)辜膊〉陌l(fā)展機制,以及探索用來作為疾病診斷的分子標識[9-10]。對結(jié)核而言,早期診斷是結(jié)核患者得到及時治療以及預(yù)防傳播的關(guān)鍵,但目前結(jié)核病診斷手段不足,迫切需要鑒定出更有效的診斷標識,為開發(fā)更加快速、簡便的診斷方法提供基礎(chǔ)。SWEENEY TE及同事基于對14個數(shù)據(jù)庫中的2 572個樣品的薈萃分析并在臨床樣本中驗證后發(fā)現(xiàn),GBP5、DUSP3和KLF2的三基因組合能夠很好地區(qū)分ATB(AUC為0.90)。進一步的多數(shù)據(jù)庫的診斷效果分析發(fā)現(xiàn),該三基因組合在鑒別診斷TB患者和HC或LTBI的效果較好,AUC分別為0.9(敏感性85%,特異性93%)和0.88(敏感性80%,特異性86%);但在區(qū)分其他疾病時效果稍差,AUC只為0.84(敏感性81%,特異性74%)[6]。本研究中,我們也同步評估了GBP5、DUSP3和KLF2的三基因組合,但區(qū)分結(jié)核的診斷效果遠達不到文獻的水平(數(shù)據(jù)未展示)。我們認為主要原因是實驗對象人群和實驗分組不同:本項目的實驗?zāi)康氖悄M全真臨床下,診斷標識在ATB診斷的效率。因此,診斷標識不僅能區(qū)分于HC與LTBI,更重要的是區(qū)分TB以及RxTB。另外,PANKHURSTLJ及同事在多中心對比了全基因組學(xué)和常規(guī)檢測技術(shù)對檢測Mtb標本的效果,發(fā)現(xiàn)全基因組測序(WGS)的Mtb預(yù)測準確率達93%,藥物敏感性為93%,不過該基于WGS的結(jié)核檢測卻需要長達9天的時間,難以滿足及時快捷的診斷要求[11]。
我們前期的一項基于芯片技術(shù)對受試者外周血進行全轉(zhuǎn)錄組表達譜分析研究中篩選出了127個差異表達基因,其中77個基因在TB患者高表達,50個基因在TB患者低表達;進一步在治療前后TB患者中分析發(fā)現(xiàn)有12個基因經(jīng)抗結(jié)核治療后表達量顯著下降(比如HBA1、HBA2和血紅蛋白-α等)[7]。本研究是前期研究的延續(xù),在本研究中我們首先利用特征選擇(SVM)策略,篩選鑒定出了CD157、GSDMD和VAMP5的三基因組合能夠用于診斷和區(qū)分TB患者與HC。進一步開發(fā)了單管同步檢測實時熒光定量PCR(RT-qPCR)技術(shù)用于同步檢測分析該3個基因;穩(wěn)定性和重復(fù)性分析證明,該三基因的表達在新鮮和凍存外周血(PBMC)中的表達量沒有顯著性變化,具有很好的表達穩(wěn)定性和重復(fù)性。進而利用建模策略,搭建了基于CD157、GSDMD和VAMP5的三基因NNET模型,該模型在獨立的測試集上區(qū)分和診斷TB的準確率、敏感性與特異性分別為0.75(95%CI:0.63,0.85)、0.74(95%CI:0.57,0.88)和0.76(95%CI:0.58,0.89),AUC為0.84(95%CI:0.80,0.89)。在構(gòu)建NNET的同時,我們也構(gòu)建了SVM和隨機森林(random forest,RF)模型,以比較三種不同模型間的分類效能。在準確率、敏感性和特異性上,NNET的效能最好(數(shù)據(jù)未展示)。但目前所用訓(xùn)練集數(shù)量還不足夠多,且仍存在部分感染或非感染性疾病引起的炎癥產(chǎn)生的非特異性影響。下一步,我們將收集更多的樣本對模型進行優(yōu)化,以提高模型的泛化能力和魯棒性。
綜上所述,本研究鑒定出了能夠用于區(qū)分和診斷結(jié)核的三基因組合標識及單管同步檢測技術(shù),為結(jié)核病的診斷提供了新的策略。