伍艷婷,舒文瑩,王艷平,周毅,簡曉順
在全球大多數(shù)國家,惡性腫瘤是導(dǎo)致死亡的主要原因[1],迄今為止,惡性腫瘤還沒有絕對的治愈方法。腎細(xì)胞癌是泌尿系統(tǒng)最常見的腫瘤之一,具有隱匿性,對放化療不敏感。其中腎透明細(xì)胞癌(kidney renal clear cell carcinoma,KIRC)是腎細(xì)胞癌最常見的亞型,占70%~75%,易發(fā)生轉(zhuǎn)移[2]。針對多種激酶和雷帕霉素靶點的抑制劑可提高KIRC的總體存活率,但治療反應(yīng)因個體而異,大多數(shù)患者最終會產(chǎn)生耐藥性[3]。因此,探索分析對個體化治療或臨床診斷有意義的生物標(biāo)志物,對KIRC的早期診斷和提高生存率十分重要。
自噬在腫瘤的發(fā)生、耐藥性、微環(huán)境相互作用等多個過程中發(fā)揮著至關(guān)重要的作用。自噬的發(fā)生是一個復(fù)雜的多步驟過程,受一系列自噬相關(guān)基因的嚴(yán)格控制,既可以抑制腫瘤的進展亦能促進腫瘤的進展[4],惡性腫瘤可以誘導(dǎo)微環(huán)境的非腫瘤細(xì)胞自噬,從而進一步促進腫瘤的生長和進展[5]。自噬相關(guān)的化療耐藥性是癌癥治療的一大挑戰(zhàn)。目前,自噬相關(guān)基因在多藥耐藥中的作用越來越受重視,研究發(fā)現(xiàn),自噬基因有望成為癌癥的治療靶點[6-8]。
但由于傳統(tǒng)研究的局限性,大多集中在單基因?qū)δ[瘤影響的研究上,很少使用大規(guī)模基因表達隊列研究自噬與KIRC預(yù)后的關(guān)系。近年來,隨著自噬在腫瘤中的作用不斷被研究,研究人員發(fā)現(xiàn)自噬相關(guān)基因可以作為預(yù)后生物標(biāo)志物并成為潛在的治療靶點[9]。為了更好地探索自噬相關(guān)基因?qū)εR床預(yù)后的影響,利用大型公共數(shù)據(jù)庫篩選和驗證KIRC自噬相關(guān)預(yù)后標(biāo)志物已成為基礎(chǔ)研究的重要補充和發(fā)展趨勢。
本研究通過構(gòu)建一個新的預(yù)后模型用于預(yù)測KIRC患者的總生存期(OS),并探索了由該模型基因定義的獨特分子特征,包括免疫浸潤和潛在的藥物靶點。這為KIRC預(yù)后、免疫治療和藥物敏感性評價提供了一種新的思路和方法,報道如下。
1.1 數(shù)據(jù)收集 從UCSC xena數(shù)據(jù)庫(https://xenabrowser.net/datapages/)下載24種常見癌種的表達數(shù)據(jù)log2(FPKM+1)(FPKM:每千個堿基的轉(zhuǎn)錄每百萬映射讀取的fragments)、表型數(shù)據(jù)和生存數(shù)據(jù),通過R軟件4.1.2將其表達數(shù)據(jù)轉(zhuǎn)換為TPM(每千個堿基的轉(zhuǎn)錄每百萬映射讀取的Transcripts)數(shù)據(jù);從人類自噬數(shù)據(jù)庫(http://autophagy.lu/)中下載222個自噬相關(guān)基因,于GEPIA數(shù)據(jù)庫(http://gepia.cancer-pku.cn/)中做與24種常見癌種的生存分析,最終得到159個與癌癥預(yù)后相關(guān)的自噬相關(guān)基因(ARGs)。
1.2 自噬基因集在癌癥中的表達情況 使用R包“GSVA”進行單樣本基因集富集分析(ssGSEA)得到自噬評分(autophagy score)以量化ARGs在24種癌癥中的表達水平,Kruskal-Wallis分析各癌癥間的表達是否存在差異;Mann-WhitneyU檢驗評估23種癌癥的腫瘤樣本與正常樣本間的差異[其中腎上腺皮質(zhì)癌(ACC)無正常樣本,故未納入后面的分析];以自噬評分的中位數(shù)來定義高評分組與低評分組。
1.3 篩選KIRC差異表達基因 使用“edgeR”包比較KIRC患者的腫瘤樣本和正常樣本的基因表達差異(來自UCSC xena數(shù)據(jù)庫的counts數(shù)據(jù)),篩選條件為|logFC|> 1,錯誤發(fā)現(xiàn)率(FDR)<0.05。
1.4 預(yù)后模型的構(gòu)建 將531例KIRC患者數(shù)據(jù)隨機分為訓(xùn)練集354個(占總KIRC數(shù)據(jù)的2/3)和測試集177個(占總KIRC數(shù)據(jù)的1/3);將159個ARGs與KIRC的差異表達基因取交集得到差異表達自噬相關(guān)基因(DEARGs);對訓(xùn)練集進行逐步回歸分析、LASSO回歸分析確定最終模型基因,根據(jù)多因素Cox回歸分析的回歸系數(shù)和基因的表達量,建立風(fēng)險預(yù)后模型,建立預(yù)后模型公式為:風(fēng)險評分(risk score)=∑(基因表達量×回歸系數(shù)),測試集用于驗證其預(yù)后能力。
1.5 預(yù)后模型的評估和驗證 根據(jù)預(yù)后模型公式計算風(fēng)險評分,以風(fēng)險評分的中位數(shù)來定義高風(fēng)險組和低風(fēng)險組。繪制生存曲線和受試者工作特征曲線(ROC),并計算曲線下面積(AUC)以評估模型的特異度和敏感度。根據(jù)風(fēng)險評分值進行排序,分布曲線、散點圖和熱圖顯示不同風(fēng)險組的風(fēng)險評分分布,患者生存狀態(tài)及模型基因的表達情況。將風(fēng)險評分與腫瘤大小(T)、淋巴結(jié)轉(zhuǎn)移(N)、遠(yuǎn)處轉(zhuǎn)移(M)、種族(Race)、年齡(Age)、性別(Sex)、臨床分期(Stage)、病理分級(Grade)做單因素和多因素Cox回歸分析,確定預(yù)后的獨立影響因素。列線圖、ROC曲線預(yù)測患者1、3、5年的生存率,并對臨床特征進行分層做生存曲線分析,以進一步分析風(fēng)險評分的臨床潛力。
1.6 預(yù)后模型基因的表達驗證 使用HPA數(shù)據(jù)庫(https://www.proteinatlas.org/)驗證模型基因在腫瘤組織和正常組織中的蛋白表達是否與差異表達分析的結(jié)果一致。
1.7 免疫細(xì)胞浸潤分析 使用CIBERSORT計算免疫細(xì)胞在每個KIRC患者中的浸潤情況。每種免疫細(xì)胞類型的總比例等于1。Mann-WhitneyU檢驗比較高低風(fēng)險組患者免疫細(xì)胞的浸潤差異情況。
1.8 藥物敏感性分析 從CellMiner數(shù)據(jù)庫(http://discover.nci.nih.gov/cellminer/)中下載NCI-60 細(xì)胞系的RNA表達數(shù)據(jù)和藥物分析數(shù)據(jù),選取經(jīng)過臨床試驗和FDA批準(zhǔn)的792個藥物結(jié)果。提取模型基因的表達數(shù)據(jù),計算藥物敏感性(IC50),并進行Pearson相關(guān)性分析,最終得到每個模型基因的表達與藥物敏感性之間的相關(guān)性。以P<0.01對分析結(jié)果進行篩選。
1.9 統(tǒng)計學(xué)分析 使用R軟件4.1.2對數(shù)據(jù)進行統(tǒng)計分析和結(jié)果可視化。P<0.05為差異具有統(tǒng)計學(xué)意義。
2.1 ARGs在癌癥中的表達差異情況 ssGSEA結(jié)果顯示, ARGs在KIRC中表達最高,腎嫌色細(xì)胞癌(KICH)中表達最低(圖1A)。Mann-WhitneyU檢驗結(jié)果發(fā)現(xiàn),ARGs在14種癌癥的腫瘤樣本與正常樣本之間表達存在差異(圖1B),其中ARGs在多形性成膠質(zhì)細(xì)胞瘤(GBM)、KIRC、腎乳頭狀細(xì)胞癌(KIRP)和甲狀腺癌(THCA)的腫瘤樣本中表達水平高于正常樣本,在膀胱尿路上皮癌(BLCA)、乳腺浸潤癌(BRCA)、結(jié)腸癌(COAD)、頭頸鱗狀細(xì)胞癌(HNSC)、肝細(xì)胞肝癌(LIHC)、肺腺癌(LUAD)、肺鱗癌(LUSC)、前列腺癌(PRAD)、直腸腺癌(READ)、胃癌(STAD)的腫瘤樣本中表達水平低于正常樣本(圖1C),而在宮頸鱗癌和腺癌(CESC)、食管癌(ESCA)、KICH、胰腺癌(PAAD)、嗜鉻細(xì)胞瘤和副神經(jīng)節(jié)瘤(PCPG)、肉瘤(SARC)、皮膚黑色素瘤(SKCM)、胸腺癌(THYM)、子宮內(nèi)膜癌(UCEC)中表達無差異性。對有差異表達的癌種進行單因素Cox回歸分析,發(fā)現(xiàn)自噬評分與KIRC、LUSC的OS相關(guān)(圖1D)。
注:A.ARGs在各癌癥中的自噬評分;B.正常樣本與腫瘤樣本之間自噬評分存在差異的癌癥;C.正常樣本與腫瘤樣本自噬評分的中位數(shù);D.單因素Cox回歸分析森林圖。*P<0.05,**P<0.01,***P<0.001,****P<0.0001。BLCA.膀胱尿路上皮癌;BRCA.乳腺浸潤癌;COAD.結(jié)腸癌;KIRP.腎乳頭狀細(xì)胞癌;HNSC.頭頸鱗狀細(xì)胞癌;KIRC.腎透明細(xì)胞癌;LIHC.肝細(xì)胞肝癌;READ.直腸腺癌;LUSC.肺鱗癌;GBM.多形性成膠質(zhì)細(xì)胞瘤;STAD.胃癌;THCA.甲狀腺癌;PRAD.前列腺癌;LUAD.肺腺癌。
2.2 自噬評分對KIRC患者預(yù)后的影響 生存曲線分析結(jié)果顯示,KIRC低評分患者的預(yù)后比高評分患者差(P=0.039)(圖2A),LUSC高評分患者的預(yù)后比低評分患者差(P=0.034)(圖2D),這與已有文獻結(jié)果一致[10-11]。單因素、多因素Cox回歸分析結(jié)果發(fā)現(xiàn),自噬評分可以作為KIRC患者預(yù)后的獨立影響因素(圖2B、2C),但不能作為LUSC患者的獨立預(yù)后因素(圖2E、2F)。
注:A.KIRC高低自噬評分組的生存曲線;B、C.影響KIRC預(yù)后的單、多因素Cox回歸分析森林圖;D.LUSC高低自噬評分組的生存曲線;E、F.影響LUSC預(yù)后的單、多因素Cox回歸分析森林圖。
2.3 確定KIRC差異表達的自噬相關(guān)基因并構(gòu)建預(yù)后模型 KIRC的正常樣本與腫瘤樣本差異表達分析結(jié)果得到9 632個差異表達基因,將其與上述ARGs取交集,得到35個DEARGs(圖3A)。其中有6個基因在腫瘤組織中下調(diào),29個基因在腫瘤組織中上調(diào)(圖3B)。對DEARGs進行逐步回歸分析、LASSO回歸分析,最終確定4個模型基因:BAG1、BIRC5、BNIP3、EIF4EBP1?;诙嘁蛩谻ox回歸分析結(jié)果(表1)構(gòu)建預(yù)后模型,發(fā)現(xiàn)BIRC5和EIF4EBP1是高風(fēng)險基因(HR>1),而BAG1和BNIP3是低風(fēng)險基因(HR<1)。風(fēng)險評分=(-0.037)×BAG1表達量+0.021×BIRC5表達量+(-0.003)×BNIP3表達量+0.003×EIF4EBP1表達量。免疫組化結(jié)果表明,與正常組織相比,KIRC組織中的BAG1(HPA018121)、BIRC5(HPA002830)、BNIP3(HPA003015)和EIF4EBP1(CAB005032)的蛋白水平上調(diào)(圖3C),除BAG1外,其他3個基因的蛋白表達與DEARGs的表達結(jié)果一致。
注:A.差異表達基因與自噬相關(guān)基因維恩圖;B.35個差異表達自噬相關(guān)基因熱圖;C.正常組織和腫瘤組織4個模型基因的蛋白水平比較。
表1 多因素Cox回歸分析預(yù)后模型基因?qū)︻A(yù)后的影響
2.4 模型對KIRC患者的臨床預(yù)后價值 生存曲線結(jié)果顯示,高風(fēng)險組患者的預(yù)后比低風(fēng)險組患者差(訓(xùn)練集P<0.001,AUC=0.755,見圖4A、4B;測試集P<0.001,AUC=0.695,見圖4C、4D)。風(fēng)險因子關(guān)聯(lián)圖結(jié)果顯示,風(fēng)險評分值越高,患者死亡數(shù)越多,訓(xùn)練集(圖4E)與測試集(圖4F)結(jié)果基本一致。其中熱圖顯示,BIRC5和EIF4EBP1在高風(fēng)險組中上調(diào),是危險因素,而BAG1和BNIP3在高風(fēng)險組中下調(diào),是有利因素,與多因素Cox回歸結(jié)果一致。
注:A、B.訓(xùn)練集生存曲線和ROC曲線;C、D.測試集生存曲線和ROC曲線;E、F.訓(xùn)練集和測試集風(fēng)險因子關(guān)聯(lián)圖,分布曲線(上)、散點圖(中)和熱圖(下)。
單因素和多因素Cox回歸分析結(jié)果發(fā)現(xiàn),構(gòu)建的模型風(fēng)險評分、M分期和N分期均可作為KIRC患者預(yù)后的獨立影響因素(P<0.05)(圖5A、5B)。為了更好地預(yù)測KIRC患者1、3、5年的生存率,構(gòu)建了列線圖(圖5C)并繪制ROC曲線,AUC分別為0.743、0.740、0.699(圖5D)。為了進一步研究風(fēng)險評分的臨床預(yù)后潛力,基于臨床特征(TNM分期、臨床分期、腫瘤分級)進行生存曲線分析,發(fā)現(xiàn)風(fēng)險評分似乎更適合用于預(yù)測臨床分期、腫瘤分級、T期、M0期和N0期的總生存時間,除M1、N1期外,高風(fēng)險評分患者的預(yù)后均比低風(fēng)險評分患者差(P<0.05)(圖5E)。
注:A、B.單因素、多因素Cox回歸分析森林圖;C、D.列線圖和ROC曲線;E.生存曲線。
2.5 高低風(fēng)險組免疫細(xì)胞浸潤情況比較 基于自噬與免疫細(xì)胞浸潤的相關(guān)性,計算了每個樣本中腫瘤免疫微環(huán)境22種免疫細(xì)胞的浸潤情況(圖6A),評估了不同風(fēng)險組中免疫微環(huán)境的組成。與低風(fēng)險組比較,高風(fēng)險組中CD8+T細(xì)胞、輔助性濾泡T細(xì)胞、調(diào)節(jié)性T細(xì)胞和M0巨噬細(xì)胞等比例顯著升高,而靜息殺傷細(xì)胞、單核細(xì)胞和靜息肥大細(xì)胞等比例顯著降低(圖6B、C)。
注:A.KIRC患者22種免疫細(xì)胞浸潤比例;B、C.訓(xùn)練集、測試集高低風(fēng)險組免疫細(xì)胞浸潤差異。*P<0.05,**P<0.01,***P<0.001,****P<0.0001。
2.6 模型基因的表達與多種藥物敏感性的關(guān)系 表2顯示每個基因與藥物敏感性(IC50)最相關(guān)的前4個結(jié)果。在60個癌細(xì)胞系中BAG1與白屈菜紅堿、AM-5992、7-羥基星形孢菌素呈正相關(guān),與INK-128(mTOR抑制劑)呈負(fù)相關(guān);BIRC5與SNS-314(極光激酶抑制劑)、5-氟脫氧尿苷10、博來霉素呈正相關(guān),與司美替尼呈反比;BNIP3與P-529(mTOR抑制劑)、特拉替尼、IDH-C227(IDH1R132H抑制劑)呈正相關(guān),與AM-5992呈負(fù)相關(guān);EIF4EBP1與SNS-314、氟尿苷、奎扎替尼、維甲酰酚胺呈正相關(guān)。
表2 基因表達與藥物敏感性的相關(guān)性
在8個腎癌細(xì)胞系中BAG1與丁硫氨酸—亞砜亞胺、PF-2771(CENP-E抑制劑)、三氧化二砷呈負(fù)相關(guān),與帕博西尼呈正相關(guān);BIRC5與恩曲替尼、Gandotinib(JAK2抑制劑)、AMD-070(CXCR4選擇性抑制劑)、替沃扎尼呈負(fù)相關(guān);BNIP3與Saridegib(Smo 特異性抑制劑)、阿扎胞苷、卡鉑呈正相關(guān),與CH-5132799(PI3K抑制劑)呈負(fù)相關(guān);EIF4EBP1與AZD-5363、GSK-2141795、Afuresertib、Ipatasertib(AKT抑制劑)呈負(fù)相關(guān),見表2。
目前,盡管有大量研究表明自噬參與了KIRC的惡性進展,但以往的研究中僅探索了單個自噬相關(guān)基因與KIRC之間的相關(guān)性[12-16],缺乏對自噬相關(guān)基因在各癌癥中的表達分析,且與多種癌癥預(yù)后相關(guān)的自噬相關(guān)基因與KIRC患者預(yù)后之間的相關(guān)性尚未明確。雖然目前有文獻報道了自噬相關(guān)基因?qū)IRC患者預(yù)后的影響[17-19],但涉及的基因多,臨床經(jīng)濟實用性欠缺,且未曾發(fā)現(xiàn)有相關(guān)研究解釋上述所有4個基因在KIRC中的預(yù)后價值。在本研究中,筆者發(fā)現(xiàn)自噬相關(guān)基因在不同癌癥中的表達存在差異,其中在KIRC患者中表達最高。因此構(gòu)建了由BAG1、BIRC5、BNIP3和EIF4EBP1組成的風(fēng)險預(yù)后模型。發(fā)現(xiàn)在KIRC患者中BAG1和BNIP3是低風(fēng)險基因,其表達越高,患者風(fēng)險值越低;BIRC5和EIF4EBP1屬于高風(fēng)險基因,其表達越高,患者風(fēng)險值越高。風(fēng)險評分、M分期、N分期可以作為KIRC患者的獨立預(yù)后因素。
腫瘤微環(huán)境中包含各種細(xì)胞,其中浸潤性免疫細(xì)胞占很大比例且特定細(xì)胞對患者的生存有重大影響[20]。例如,腫瘤相關(guān)的巨噬細(xì)胞可通過多種方式幫助腫瘤細(xì)胞發(fā)生免疫逃逸、腫瘤血管生成和轉(zhuǎn)移[21-23]。上述免疫浸潤分析結(jié)果表明,與低風(fēng)險組比較,高風(fēng)險組中CD8+T細(xì)胞、輔助性濾泡T細(xì)胞、調(diào)節(jié)性T細(xì)胞和M0巨噬細(xì)胞浸潤比例升高。高風(fēng)險組的評分與患者預(yù)后呈反比,提示這些免疫細(xì)胞浸潤增加可能與KIRC患者的不良預(yù)后有關(guān)。而靜息殺傷細(xì)胞、單核細(xì)胞和靜息肥大細(xì)胞在高風(fēng)險組中浸潤比例降低,說明這些免疫細(xì)胞的浸潤增加可能與KIRC患者的良好預(yù)后有關(guān)。
近年來,自噬相關(guān)基因在多藥耐藥中的作用受到越來越多的關(guān)注。以往研究報道,在乳腺癌、結(jié)腸癌和卵巢癌細(xì)胞系中,星形孢菌素可以通過介導(dǎo)自噬蛋白p62的表達來逆轉(zhuǎn)順鉑的耐藥性[24],說明可以通過改變自噬水平或抑制自噬相關(guān)基因的表達,在一定程度上提高藥效,從而為臨床用藥提供理論依據(jù)[25]。在本研究中構(gòu)建的4個模型基因分別與多種癌細(xì)胞系的藥物敏感性相關(guān),其中在腎癌細(xì)胞系中,與BAG1表達呈正相關(guān)的藥物2個,負(fù)相關(guān)的11個;與BIRC5表達呈正相關(guān)的3個,負(fù)相關(guān)的51個;與BNIP3表達呈正相關(guān)的3個,負(fù)相關(guān)的1個;與EIF4EBP1表達呈正相關(guān)的4個,負(fù)相關(guān)的21個。且相關(guān)系數(shù)可達到0.9以上。這可能為腎癌的預(yù)后提供潛在的藥物治療靶點,但仍需要更多的試驗加以驗證,以評估該模型基因?qū)εR床試驗中新藥的影響,為新藥篩選提供選擇。
綜上所述,在本研究中,筆者從分析預(yù)后自噬相關(guān)基因在泛癌中的表達差異,聚焦到對KIRC患者的生存預(yù)后分析,確定了一種由4個差異自噬基因(BAG1、BIRC5、BNIP3和EIF4EBP1)組成的新預(yù)后標(biāo)志物模型,同時證明了該模型與KIRC 患者的OS獨立相關(guān),并發(fā)現(xiàn)其在腫瘤免疫微環(huán)境、藥物敏感性等方面也具有重要意義。但潛在的分子機制還需要進一步的實驗研究。
利益沖突:所有作者聲明無利益沖突
作者貢獻聲明
伍艷婷:提出研究方案并設(shè)計課題,實施研究過程,論文撰寫;舒文瑩:確定分析方法,論文修改;王艷平:文獻調(diào)研,資料搜集和數(shù)據(jù)整理;周毅:課題設(shè)計審核;簡曉順:提出研究思路,論文審核