劉瓊芝,黃文麗
(1.長沙市中心醫(yī)院,長沙 410028;2.長沙金域醫(yī)學(xué)檢驗實驗室有限公司,長沙 410205)
急性髓系白血?。╝cute myeloid leukemia,AML)是成人急性白血病中最常見的一種,其發(fā)病率隨著年齡增長逐漸增加,且患者預(yù)后較差[1]?,F(xiàn)今,AML的主要治療方式為化療、靶向治療和造血干細胞移植,這使AML患者病情有所緩解[2],但在臨床表現(xiàn)和治療預(yù)后方面,患者之間存在較大的異質(zhì)性。進一步探究發(fā)現(xiàn),這種異質(zhì)性更加體現(xiàn)在基因?qū)用?,?fù)發(fā)的原因可能與部分白血病細胞發(fā)生免疫逃逸,從而在骨髓中形成殘留病灶有關(guān)[3-4]。因此,進一步探究AML的骨髓微環(huán)境對于優(yōu)化治療方案以及提高 AML患者的生存率具有重要的意義。雖然既往有許多分析腫瘤微環(huán)境中免疫細胞構(gòu)成與預(yù)后之間關(guān)系的研究,但關(guān)于AML的研究較少[5]。本研究根據(jù)免疫基因構(gòu)建預(yù)后風(fēng)險模型,比較高風(fēng)險組和低風(fēng)險組AML患者之間骨髓微環(huán)境中免疫細胞的分布比例,進而分析風(fēng)險模型與AML的免疫細胞浸潤模式的相關(guān)性及其預(yù)后價值,旨在為改善AML治療和預(yù)后效果提供新的方向。
通過癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)下載141例AML(TCGA-LAML)樣本的RNA表達數(shù)據(jù)以及生存等臨床信息。本研究通過基因表達綜合(Gene Expression Omnibus,GEO)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.goc/geo/)下載轉(zhuǎn)錄組RNA測序數(shù)據(jù)集GSE15601,其中包括69例正常對照和202例AML患者的骨髓樣本。
通過R軟件包limma,以P<0.05為閾值,篩選數(shù)據(jù)集GSE15601中正常對照與AML患者的骨髓樣本間的差異表達基因。從IMMPORT數(shù)據(jù)庫(https://www.immport.org/home)中下載人類免疫及免疫相關(guān)基因。利用jvenn工具(http://jvenn.toulouse.inra.fr/)取數(shù)據(jù)集GSE15601中差異表達基因與免疫基因的交集,并繪制Venn圖,得到候選基因。
使用TCGA-LAML數(shù)據(jù)集,采用R語言包survival對55個免疫基因進行單因素COX回歸分析以及多因素COX回歸分析,建立預(yù)后風(fēng)險模型,并計算回歸模型下每位患者的風(fēng)險評分。風(fēng)險評分=各基因回歸系數(shù)×其表達水平之和。
根據(jù)風(fēng)險評分的中位值將患者分為高風(fēng)險組和低風(fēng)險組,并進行Kaplan-Meier生存分析,以比較高風(fēng)險組和低風(fēng)險組之間的總體生存期(overall survival,OS)差異,選擇P<0.05作為截止值。同時繪制風(fēng)險曲線和生存狀態(tài)圖,并基于R軟件包pheatmap繪制4個預(yù)后基因在高風(fēng)險組和低風(fēng)險組中表達的熱圖。采用R軟件包timeROC進行分析,繪制接受者操作特性曲線(receiver operating characteristic curve,ROC)以評估預(yù)后風(fēng)險模型的準(zhǔn)確性。
基于TCGA-LAML數(shù)據(jù)集中AML患者的年齡(≤65和>65)、性別(男和女)進行分組,比較組間風(fēng)險評分的差異。根據(jù)患者臨床信息(年齡、性別、生存時間)以及風(fēng)險評分,采用R軟件包rms繪制列線圖,以評估AML患者的預(yù)后。
ESTIMATE是一種預(yù)測腫瘤純度的工具,可基于基因表達數(shù)據(jù)預(yù)測腫瘤組織中浸潤的基質(zhì)/免疫細胞的存在。ESTIMATE算法基于單樣本基因集富集分析生成三個評分:基質(zhì)評分(捕獲腫瘤組織中基質(zhì)的存在)、免疫評分(表示免疫細胞在腫瘤組織中的浸潤)、ESTIMATE評分(綜合基質(zhì)評分和免疫評分,推斷腫瘤純度)[6]。我們使用R軟件包estimate(https://r-forge.r-project.org/projects/estimate/)計算高風(fēng)險組和低風(fēng)險組的基質(zhì)評分、免疫評分、ESTIMATE評分以及重量純度,并進行組間比較。
通過CIBERSORT算法估計TCGA-LAML數(shù)據(jù)集中22種免疫細胞的浸潤比例,模擬次數(shù)為1 000次[7]。基于R軟件包corrplot(https://CRAN.R-project.org/package=corrplot)對預(yù)后基因或風(fēng)險評分與免疫細胞含量進行相關(guān)性分析,以|r|>0.2且P<0.05為標(biāo)準(zhǔn)閾值,其中r為相關(guān)系數(shù)。
收集47個常見的免疫檢查點,分別為:IDO1、LAG3、CTLA4、TNFRSF9、ICOS、CD80、PDCD1LG2、TIGIT、CD70、TNFSF9、ICOSLG、KIR3DL1、CD86、PDCD1、LAIR1、TNFRSF8、TNFSF15、TNFRSF14、IDO2、CD276、CD40、TNFRSF4、TNFSF14、HHLA2、CD244、CD274、HAVCR2、CD27、BTLA、LGALS9、TMIGD2、CD28、CD48、TNFRSF25、CD40LG、ADORA2A、VTCN1、CD160、CD44、TNFSF18、TNFRSF18、BTNL2、C10orf54、CD200R1、TNFSF4、CD200、NRP1。首先,篩選出高風(fēng)險組和低風(fēng)險組間差異表達的免疫檢查點,然后,進一步基于R軟件包corrplot分析免疫檢查點表達與風(fēng)險評分的相關(guān)性,以|r|>0.3以及P<0.05為標(biāo)準(zhǔn)閾值進行篩選。
通過GEO數(shù)據(jù)庫得到AML患者和正常對照的骨髓樣本的轉(zhuǎn)錄組RNA-seq數(shù)據(jù)集GSE15061,以P<0.05為閾值篩選出差異表達的基因,選取差異表達最為顯著的前500個基因(圖1a)。同時,從IMMPORT數(shù)據(jù)庫中下載到1 793個免疫相關(guān)基因,取差異表達的基因與免疫相關(guān)基因的交集,獲得AML患者中差異表達顯著的55個免疫相關(guān)基因(圖1b)。
圖1 AML中差異表達的免疫基因的篩選Fig.1 Screening of differentially expressed immune genes in AML
在TCGA數(shù)據(jù)庫中下載AML的轉(zhuǎn)錄組RNA測序數(shù)據(jù)集TCGA-LAML,其中包含141例AML患者的骨髓樣本以及臨床信息。首選以上55個免疫基因進行單因素COX分析(以P<0.05為閾值),發(fā)現(xiàn)其中6個基因(FLT3、FGF13、CRLF3、GZMB、KLRD1、IGF2R)與AML患者的生存情況顯著相關(guān)(圖2a)。隨后,通過多因素COX分析構(gòu)建包含4個免疫基因(FGF13、GZMB、FLT3、CRLF3)的風(fēng)險模型,根據(jù)以下公式計算每位患者的風(fēng)險評分:風(fēng)險評分=(-1.645 7×ExpFGF13)+(0.064 9×ExpGZMB)+(0.002 9×ExpFLT3)+(-0.064 6×ExpCRLF3),其中Exp表示基因表達。以風(fēng)險評分中位數(shù)為分界線,將患者劃分為高風(fēng)險組和低風(fēng)險組(圖2b)。通過進一步對風(fēng)險模型中AML患者的生存狀態(tài)進行統(tǒng)計,結(jié)果發(fā)現(xiàn),高風(fēng)險組中死亡患者的數(shù)目要多于低風(fēng)險組,并且其生存時間普遍更短(圖2c)。4個免疫基因在低風(fēng)險組與高風(fēng)險組間也存在一定的差異表達(圖2d)。
圖2 基于TCGA-LAML數(shù)據(jù)集構(gòu)建預(yù)后風(fēng)險模型Fig.2 Construction of a prognostic risk model based on the TCGA-LAML dataset
Kaplan-Meier生存曲線分析結(jié)果表明,低風(fēng)險組患者的存活時間明顯高于高風(fēng)險組患者(圖3a)。ROC分析結(jié)果也顯示了風(fēng)險模型1、2、3 年總生存率的良好預(yù)測準(zhǔn)確性(圖3b)。進一步分析該風(fēng)險模型與AML患者臨床參數(shù)的相關(guān)性,結(jié)果顯示,高風(fēng)險組和低風(fēng)險組患者的性別無明顯差異(圖3c),高風(fēng)險組患者的年齡顯著高于低風(fēng)險組(圖3d)。繪制列線圖展示了風(fēng)險評分、年齡和性別對患者生存的預(yù)測能力,總得分可用于預(yù)測AML患者1、2、3年生存率(圖3e),并繪制了1年生存率的校正曲線(圖3f)。以上結(jié)果表明,由4個免疫基因(FGF13、GZMB、FLT3、CRLF3)構(gòu)建的風(fēng)險模型可準(zhǔn)確預(yù)測AML患者的預(yù)后。
圖3 風(fēng)險模型在AML患者預(yù)后中的預(yù)測價值Fig.3 Predictive value of risk models in the prognosis of AML patients
在腫瘤微環(huán)境中,免疫細胞和基質(zhì)細胞是兩種主要類型的非腫瘤組分,并且已被提出對于腫瘤的診斷和預(yù)后評估是有價值的。為了探究4個免疫基因構(gòu)建的風(fēng)險模型與AML腫瘤微環(huán)境是否相關(guān),我們基于EATIMATE算法計算基質(zhì)評分、免疫評分、ESTIMATE評分以及腫瘤純度,評分越高說明細胞含量越高。結(jié)果表明:高風(fēng)險組和低風(fēng)險組基質(zhì)評分無顯著差異(圖4a);高風(fēng)險組免疫評分顯著高于低風(fēng)險組(圖4b);高風(fēng)險組綜合評分顯著高于低風(fēng)險組(圖4c);高風(fēng)險組腫瘤純度顯著高于低風(fēng)險組(圖4d)。這說明,由FGF13、GZMB、FLT3、CRLF3構(gòu)建的風(fēng)險模型與免疫浸潤密切相關(guān)。
圖4 高風(fēng)險組和低風(fēng)險組AML樣本的腫瘤微環(huán)境分析Fig.4 Tumor microenvironment analysis of AML samples in high-risk group and low-risk group
前面結(jié)果顯示,該風(fēng)險模型與免疫浸潤存在顯著相關(guān)性。我們進一步通過CIBERSORT算法估計了TCGA-LAML數(shù)據(jù)集中22種免疫細胞的浸潤比例,并分析了兩組免疫細胞含量的差異。結(jié)果顯示:高風(fēng)險組中未激活的B細胞、CD8+T細胞、激活的自然殺傷細胞的含量顯著高于低風(fēng)險組,同時,以上免疫細胞的含量與風(fēng)險評分顯著正相關(guān)(圖5a~5c、5e);高風(fēng)險組中未激活的CD4+T細胞、靜息的肥大細胞的含量顯著低于低風(fēng)險組,同時,以上免疫細胞的含量與風(fēng)險評分顯著負相關(guān)(圖5a、5d、5f)。
圖5 基于CIBERSORT算法估計高風(fēng)險組和低風(fēng)險組免疫細胞含量Fig.5 Estimation of immune cell content in high-risk group and low-risk group based on CIBERSORT
本文分析了47個常見的免疫檢查點在高風(fēng)險組和低風(fēng)險組的表達,其中15個免疫檢查點的表達存在顯著差異(圖6a)。相關(guān)性分析結(jié)果顯示,其中4個免疫檢查點(CTLA4、PDCD1、KIR3DL、LAG3)與風(fēng)險評分的相關(guān)性顯著,且均為正相關(guān)(圖6b~6f)。這也進一步體現(xiàn)了該風(fēng)險模型在AML患者免疫治療中的應(yīng)用潛力。
圖6 風(fēng)險模型與免疫檢查點相關(guān)性分析Fig.6 Correlation analysis between risk model and immune checkpoint
為了進一步探究風(fēng)險模型中4個免疫基因(FGF13、GZMB、FLT3、CRLF3)與AML患者生存、免疫細胞含量的相關(guān)性。我們基于TCGA-LAML數(shù)據(jù)集,根據(jù)基因高/低表達進行分組。Kaplan-Meier生存曲線分析結(jié)果表明:高表達FGF13、CRLF3組患者的存活時間明顯高于低表達組患者(圖7a、7g);高表達GZMB、FLT3組患者的存活時間明顯低于低表達組患者(圖7c、7e)。免疫細胞的含量差異分析結(jié)果表明:高表達和低表達FGF13組間靜息的CD4+記憶T細胞、單核細胞、M2巨噬細胞、靜息的肥大細胞含量存在顯著差異(圖7b);高表達和低表達GZMB組間未激活的B細胞、漿細胞、CD8+T細胞、激活的CD4+T細胞、靜息的自然殺傷細胞、靜息的樹突狀細胞、靜息的肥大細胞、嗜酸性粒細胞的含量存在顯著差異(圖7d);高表達和低表達CRLF3組間γδ T細胞、M2巨噬細胞、嗜酸性粒細胞、中性白細胞含量存在顯著差異(圖7h);高表達和低表達CRLF3組間靜息的CD4+T細胞、激活的自然殺傷細胞含量存在顯著差異(圖7f)。
圖7 FGF13、GZMB、FLT3、CRLF3與AML患者生存、免疫細胞含量的相關(guān)性Fig.7 Correlation between FGF13, GZMB, FLT3, CRLF3 and survival and immune cell content in AML patients
AML作為一種侵襲性的血液惡性腫瘤,疾病進展快速且預(yù)后較差,目前認為這與骨髓微環(huán)境相關(guān)[8]。骨髓微環(huán)境是由免疫細胞、基質(zhì)細胞、細胞外基質(zhì)以及細胞因子等一起構(gòu)成的動態(tài)系統(tǒng)。其中,基質(zhì)細胞和免疫細胞是AML發(fā)生發(fā)展所必需的主要成分[9]。AML的骨髓微環(huán)境在患者治療和預(yù)后中發(fā)揮著極其重要的作用,然而,其中相關(guān)細胞及分子在AML預(yù)后中的作用并不清楚[10]。本研究基于141例TCGA-LAML樣本,通過EATIMATE算法計算高風(fēng)險組和低風(fēng)險組的基質(zhì)評分、免疫評分、ESTIMATE評分以及腫瘤純度,結(jié)果顯示,免疫細胞浸潤可能在AML腫瘤微環(huán)境中發(fā)揮了重要作用。鑒于AML患者骨髓微環(huán)境的免疫特征仍然不是很清楚,我們有必要對于骨髓微環(huán)境中免疫細胞浸潤模式進行進一步的探究,篩選免疫相關(guān)預(yù)后基因,建立準(zhǔn)確性良好的預(yù)后風(fēng)險模型,并為AML患者個體化治療提供重要的參考價值。
目前尚缺乏免疫基因相關(guān)AML預(yù)后評估模型。本研究首次提出4個重要的免疫基因(FGF13、GZMB、FLT3、CRLF3)構(gòu)建的風(fēng)險評估模型可準(zhǔn)確預(yù)測AML患者的預(yù)后,其中,F(xiàn)GF13、CRLF3為低風(fēng)險基因,GZMB、FLT3為高風(fēng)險基因。研究發(fā)現(xiàn),F(xiàn)GF13在多種腫瘤中均發(fā)揮了一定的功能[11-12],其中,F(xiàn)GF13與肝細胞癌微環(huán)境中免疫細胞浸潤密切相關(guān)[13]。GZMB編輯的蛋白可由自然殺傷細胞和細胞毒性T淋巴細胞分泌,被認為是一種細胞毒性的促凋亡蛋白酶[14]。值得一提的是,GZMB在乳腺癌等腫瘤免疫浸潤中具有一定的功能[15]。本研究也發(fā)現(xiàn),與低表達GZMB組相比,高表達GZMB組CD8+T細胞、靜息的自然殺傷細胞等的含量顯著升高,靜息的肥大細胞、嗜酸性粒細胞等的含量顯著降低。目前已有較多的研究表明,F(xiàn)LT3與AML發(fā)生發(fā)展存在關(guān)聯(lián)[16-17],并在臨床治療上展現(xiàn)了一定的價值[18]。如Patnaik等[16]發(fā)現(xiàn),F(xiàn)LT3-ITD是一個負面的預(yù)后因素,即使在化療或干細胞移植后仍具有預(yù)后相關(guān)性,這也與本研究結(jié)果一致。CRLF3在血小板形成的最后階段發(fā)揮了關(guān)鍵作用,是血小板血癥潛在的治療靶點[19]。雖然暫無研究顯示CRLF3與骨髓微環(huán)境存在關(guān)聯(lián),但有證據(jù)表明,CRLF3在改善AML患者預(yù)后中可能存在一定的價值[20]。此外,本研究單基因預(yù)后分析結(jié)果也顯示,F(xiàn)GF13、GZMB、FLT3、CRLF3與AML預(yù)后顯著相關(guān),同時與骨髓微環(huán)境中多種免疫細胞的含量密切相關(guān)。各免疫基因發(fā)揮作用的具體機制亟待進一步探究。
越來越多的研究顯示,腫瘤浸潤性免疫細胞在預(yù)測腫瘤治療和預(yù)后效果中發(fā)揮了重要作用,部分免疫細胞亞群的作用尤為突出[21-22]?;谌ゾ矸e原理的CIBERSORT算法可以利用標(biāo)準(zhǔn)化的基因表達數(shù)據(jù)去計算不同免疫細胞亞群的相對比例,進而量化特定細胞類型的豐度,在一定程度上克服了傳統(tǒng)分析方法的缺陷[23],目前已應(yīng)用于多種腫瘤中[24-25]。本研究采用CIBERSORT算法估計AML骨髓樣本中22種免疫細胞的分布比例,并依據(jù)風(fēng)險評分將樣本分為高風(fēng)險組和低風(fēng)險組,同時比較組間免疫細胞含量的差異。在過去的十年里,免疫治療在腫瘤治療方面取得了巨大的進步,實現(xiàn)腫瘤免疫治療的一個極有希望的方法是阻斷免疫檢查點途徑[26]。本研究構(gòu)建的預(yù)后風(fēng)險模型與4個免疫檢查點(CTLA4、PDCD1、KIR3DL、LAG3)顯著相關(guān)。結(jié)合研究表明,以上免疫檢查點已在臨床上應(yīng)用廣泛[27-28]。這也進一步明確了該免疫相關(guān)的風(fēng)險模型在AML免疫治療中的應(yīng)用潛力。
綜上所述,本研究依據(jù)多種數(shù)據(jù)庫,通過生物信息學(xué)構(gòu)建了包含4個免疫相關(guān)基因(FGF13、GZMB、FLT3、CRLF3)的預(yù)后風(fēng)險模型。該模型與免疫細胞以及CTLA4等免疫檢查點密切相關(guān),同時可預(yù)測AML患者的預(yù)后。需說明的是,本研究的結(jié)論是基于公共數(shù)據(jù)庫數(shù)據(jù)以及生物信息學(xué)分析所得,仍有待開展相關(guān)體內(nèi)外試驗加以驗證,這也是本項目組今后工作的重點。本研究為探究免疫相關(guān)基因在AML骨髓微環(huán)境中的作用機制提供了生物信息學(xué)證據(jù),為后續(xù)改善AML治療和預(yù)后提供了新的靶點,具有較好的理論指導(dǎo)價值。