何俊翔 張海燕 李海 張茁(吉林大學(xué)中日聯(lián)誼醫(yī)院 泌尿外科,吉林 長春 30000; 胃腸結(jié)直腸外科)
膀胱癌(BC)是全球第九大最常見惡性腫瘤,也是常見的泌尿系統(tǒng)癌癥之一,占男性惡性腫瘤的7%,其中起源于膀胱壁的尿路上皮腫瘤占90%~95%〔1〕。據(jù)報(bào)道,僅2018年,在全球范圍內(nèi)有約549 393 例新增BC 患者及199 922 例因BC 死亡的病例〔2〕。目前,臨床上針對(duì)BC 的治療手段包括手術(shù)、輔助或新輔助化療、化療、免疫治療及靶向治療等,其中70%的BC 在治療后會(huì)復(fù)發(fā)〔3〕。近年來,隨著DNA 測序及對(duì)基因表達(dá)研究的不斷深入,研究者發(fā)現(xiàn)了大量與BC 發(fā)病、進(jìn)展及復(fù)發(fā)相關(guān)的DNA、RNA 和蛋白質(zhì)生物標(biāo)志物,無疑為BC 的診斷、靶向治療及預(yù)測預(yù)后方面提供了新思路〔4〕。通過篩選和識(shí)別潛在的生物標(biāo)志物,以指導(dǎo)早期檢測、預(yù)測預(yù)后和預(yù)測治療效果,極大程度上促進(jìn)BC 患者精準(zhǔn)治療。早期研究證實(shí),P53、成纖維細(xì)胞生長因子受體(FGFR)3、人類表皮生長因子受體(HER)2、表皮生長因子受體(EGFR)、磷脂酰肌醇-3 激酶編碼基因(PIK3CA)等多個(gè)基因的異常表達(dá)與BC 預(yù)后密切相關(guān)〔5〕。此外,有研究證實(shí)細(xì)胞程序性死亡配體(PDL)1 及轉(zhuǎn)化生長因子(TGF)-β 等在腫瘤發(fā)病機(jī)制中的關(guān)鍵作用,并由此衍生出一系列免疫阻斷療法在臨床已取得了可觀的療效。PD-L1 通過與其相應(yīng)的受體相互作用來抑制免疫反應(yīng)。程序性死亡受體(PD)-1 在激活的免疫細(xì)胞上表達(dá),而PD-L1 在腫瘤細(xì)胞上表達(dá)。在癌細(xì)胞上表達(dá)的PD-L1 使細(xì)胞毒性T 細(xì)胞失活并減弱腫瘤微環(huán)境中的免疫監(jiān)視〔6〕。TGF-β 通過抑制多種免疫細(xì)胞〔如細(xì)胞毒性T 細(xì)胞、樹突細(xì)胞(DC)和自然殺傷細(xì)胞(NK)細(xì)胞〕的增殖、分化,降低這些細(xì)胞的免疫能力來促進(jìn)癌細(xì)胞的免疫逃逸,TGF-b 途徑的激活表明患者預(yù)后差并導(dǎo)致對(duì)免疫阻斷藥物的抗性〔7〕。多項(xiàng)研究均證明免疫治療在膀胱癌的治療進(jìn)展中有重要作用。本文基于TCGA 公共數(shù)據(jù)庫,為了構(gòu)建更準(zhǔn)確的預(yù)后特征,采用單變量Cox 分析及最小絕對(duì)收縮和選擇算子(LASSO)和支持向量機(jī)遞歸特征消除(簡稱SVM-RFE)這兩種算法來選擇重要的候選特征RNA。推測這種RNA 特征的有效性是基于對(duì)免疫浸潤水平的患者特征的識(shí)別,并且這種特征對(duì)于臨床BC 患者具有非常準(zhǔn)確的預(yù)后價(jià)值。
1.1 數(shù)據(jù)收集和處理 BC 患者的轉(zhuǎn)錄組數(shù)據(jù)和相關(guān)臨床信息均來自 TCGA 數(shù)據(jù)庫( https:/ /portal. gdc. cancer. gov/)。使用R 包處理下載文件。不合格數(shù)據(jù)被轉(zhuǎn)換并剔除。所有數(shù)據(jù)經(jīng)過校準(zhǔn)、標(biāo)準(zhǔn)化和log2 轉(zhuǎn)換。本研究將424 個(gè)樣本(19 個(gè)正常樣本和405 個(gè)腫瘤樣本)納入研究,并將實(shí)驗(yàn)分為對(duì)照組(正常組織樣本)與實(shí)驗(yàn)組(BC 患者)。
1.2 差異表達(dá)基因篩選使用 使用“l(fā)imma”R 包在兩組之間進(jìn)行RNA 的差異表達(dá)分析。根據(jù)調(diào)整后的P<0.05 和|Log2差異倍數(shù)(FC)|>1 的標(biāo)準(zhǔn)鑒定差異表達(dá)的基因。顯著上調(diào)或下調(diào)的基因用于后續(xù)分析。
1.3 機(jī)器學(xué)習(xí)篩選差異基因 將上述的差異基因篩選其|Log2FC|>2 的差異表達(dá)基因通過對(duì)兩種算法的綜合分析選擇候選預(yù)后RNA,這兩種算法包括LASSO 回歸分析及SVM-RFE 算法取其交集基因。在過濾差異表達(dá)的RNA 后,R 中的單變量Cox 分析用于確定差異表達(dá)RNA 的表達(dá)水平與患者總生存期(OS)之間的關(guān)聯(lián),P<0.05 被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。受試者工作特征(ROC)曲線用于估計(jì)預(yù)測的準(zhǔn)確性和效率。所有生存分析和圖形在R 環(huán)境下使用特定的R 包進(jìn)行。
1.4 基因功能和通路富集分析 使用R 包“clusterProfiler”進(jìn)行分析,京都基因和基因組百科全書(KEGG)、基因本體論數(shù)據(jù)庫(GO)對(duì)差異表達(dá)基因的功能進(jìn)行注釋。通過GSEA 基因集富集分析對(duì)實(shí)驗(yàn)組與對(duì)照組樣本進(jìn)行功能分析。P<0.05 表示功能注釋的顯著豐富。
1.5 免疫浸潤水平分析 為了量化BC 樣本中免疫細(xì)胞的比例,使用CIBERSORT 算法,即使用一組參考基因的反卷積算法表達(dá)值(具有547 個(gè)基因的特征)被認(rèn)為是每種細(xì)胞類型的最小表示,以使用支持向量回歸推斷來自具有混合細(xì)胞類型的大塊腫瘤樣本的數(shù)據(jù)中的細(xì)胞類型比例。使用表達(dá)數(shù)據(jù)(ESTIMATE)方法估計(jì)惡性腫瘤中的基質(zhì)和免疫細(xì)胞,以推斷腫瘤樣本中基質(zhì)和免疫細(xì)胞的比例,用于計(jì)算兩個(gè)數(shù)值變量之間的相關(guān)系數(shù)。
2.1 BC 相關(guān)RNA 的獲取 TCGA 數(shù)據(jù)庫中共提取55 141 個(gè)RNA 基質(zhì)表達(dá),使用“l(fā)imma”R 包分析差異表達(dá)基因,共獲得1 668 個(gè)顯著差異mRNA(|log2FC|>1,P<0.05)。此外,為獲取差異更顯著的基因?qū)log2FC|調(diào)整為>2,共獲得275 個(gè)基因。
2.2 BC 中具有預(yù)后作用的RNA 的篩選 為進(jìn)一步驗(yàn)證和選擇兩組亞型分類具有顯著特征價(jià)值的RNA,采用LASSO 算法和SVM-RFE 來識(shí)別275 個(gè)顯著差異RNA(|log2FC|>1,P<0.05)。結(jié)合LASSO和SVM-RFE 算法篩選出的RNA 后,鑒定出這兩種算法同時(shí)選擇的7 個(gè)RNA 確定為分類的候選特征基因〔人乳鐵蛋白基因(HLF)、F10、CLEC3B、LINC01082、PGM5-AS1、上皮膜蛋白(EMP)1、基質(zhì)金屬蛋白酶(MMP)11〕。通過單變量Cox 比例風(fēng)險(xiǎn)回歸分析顯示HLF 的風(fēng)險(xiǎn)比和95%CI分別為1.292 和1.064~1.570(P=0.010);F10 的風(fēng)險(xiǎn)比和95%CI分別為1.302 和1.090~1.556(P=0.004);EMP1 的風(fēng)險(xiǎn)比和95%CI分別為1.286 和1.164~1.421(P<0.001),獲得了3 個(gè)RNA(HLF、F10和EMP1)。進(jìn)一步通過ROC 曲線下面積(AUC)預(yù)測其準(zhǔn)確性(圖1)HLF、F10 和EMP1 的AUC 分別為0.984,95%CI:0.968~0.995、0.989,95%CI:0.978~0.997;0.956,95%CI:0.923~0.981,最終這3 個(gè)RNA為被確定為分類和預(yù)后的候選特征RNA。將特征基因的表達(dá)量以中位值為界分為高低表達(dá)組后,研究其總生存率(OS),K-M 分析結(jié)果顯示,低風(fēng)險(xiǎn)組OS 顯著優(yōu)于高風(fēng)險(xiǎn)組(P<0.05),見圖1。
圖1 HLF、F10 和EMP1 的ROC 曲線和K-M 生存曲線
2.3 免疫細(xì)胞浸潤分析 基于TIMER 和CIBERSORT 算法,針對(duì)樣本中各種免疫細(xì)胞比例進(jìn)行計(jì)算,結(jié)果見圖2A。同時(shí),計(jì)算樣本中個(gè)免疫細(xì)胞的相關(guān)性見圖2B。然后,評(píng)估兩組之間免疫細(xì)胞成分的差異。初始B 細(xì)胞、記憶性靜息CD4 T 細(xì)胞和活化肥大細(xì)胞在對(duì)照組中的含量高于實(shí)驗(yàn)組,而M0巨噬細(xì)胞和M1 巨噬細(xì)胞在實(shí)驗(yàn)組中的含量高于對(duì)照組。此外,通過Spearman 相關(guān)分析,對(duì)篩選的特征基因研究其與免疫細(xì)胞的相關(guān)性并使用棒棒糖圖可視化相關(guān)系數(shù),見圖2C。
圖2 免疫細(xì)胞浸潤分析
2.4 識(shí)別差異基因的生物過程和途徑 為進(jìn)一步研究差異基因的生物行為,根據(jù)|log2FC| >2,P<0.05 的標(biāo)準(zhǔn)進(jìn)行GO 功能富集分析,KEGG 富集分析,GSEA 富集分析(圖3),結(jié)果表明,在多條通路中顯著富集。
圖3 功能分析及富集分析
近年來,臨床上針對(duì)BC 的治療僅限于手術(shù)和免疫療法或化學(xué)療法。目前,對(duì)分子改變的廣泛分析導(dǎo)致了新的治療方法〔8〕。因此,針對(duì)BC 中癌癥干細(xì)胞的治療方面可能是有希望的。本研究結(jié)果表明,特征基因存在于肌肉系統(tǒng)過程、染色體分離、染色體分離等參與了細(xì)胞膠原的細(xì)胞外基質(zhì)、收縮纖維、肌原纖維等在分子功能方面、差異基因與細(xì)胞外基質(zhì)結(jié)構(gòu)成分、糖胺聚糖結(jié)合、肌動(dòng)蛋白結(jié)合等有關(guān)。同時(shí)在PI3K-蛋白激酶(Akt)信號(hào)通路、cGMPPKG 信號(hào)通路、ECM-受體相互作用、p53 信號(hào)通路、MAPK 信號(hào)通路等通路中顯著富集,DO 疾病富集也證實(shí)其與多種癌癥有關(guān)。
本研究篩選的3 個(gè)BC 預(yù)后和診斷生物標(biāo)志物(HLF、F10 和EMP1),有的已被證明是其他人類癌癥的預(yù)后生物標(biāo)志物。先前研究證實(shí),在腎透明細(xì)胞癌中存在的晚期和高級(jí)別腫瘤中發(fā)現(xiàn)了HLF 表達(dá)下調(diào)。同時(shí),HLF 低表達(dá)與腎細(xì)胞癌患者的無進(jìn)展生存期和總生存期較短有關(guān),其高表達(dá)與腎癌患者的良好預(yù)后相關(guān),這些結(jié)果表明HLF 在腎細(xì)胞癌中的臨床相關(guān)性和潛在的保護(hù)作用〔9〕。有文獻(xiàn)報(bào)道,HLF 的失調(diào)與非小細(xì)胞肺癌(NSCLC)的復(fù)發(fā)和轉(zhuǎn)移有關(guān),在早期復(fù)發(fā)的NSCLC 組織中顯著降低的HLF 與NSCLC 患者的早期進(jìn)展和遠(yuǎn)處轉(zhuǎn)移顯著相關(guān)〔10〕。F10 最早于葡萄胎及早孕絨毛的差異cDNA文庫中篩選出的基因片段,與滋養(yǎng)細(xì)胞的發(fā)生發(fā)展及轉(zhuǎn)移密切相關(guān)〔11〕。有研究指出F10 基因通過促進(jìn)G1/S-特異性周期蛋白(cyclin)D1 的表達(dá)加快細(xì)胞周期的進(jìn)展,促進(jìn)細(xì)胞增殖〔12,13〕。蘇曉華等〔14,15〕多項(xiàng)研究觀察到F10 基因通過上調(diào)多種MMP,下調(diào)MMP 組織抑制物的表達(dá),促進(jìn)絨癌細(xì)胞的增殖及轉(zhuǎn)移。綜上,F10 作為癌基因,通過調(diào)節(jié)細(xì)胞周期及細(xì)胞凋亡,參與了多種腫瘤細(xì)胞的增殖分化及轉(zhuǎn)移進(jìn)程。EMP1 是一種小的疏水性糖蛋白,包括160 個(gè)氨基酸和4 個(gè)跨膜結(jié)構(gòu)域〔16,17〕。研究證實(shí)其參與細(xì)胞增殖,與腦膠質(zhì)細(xì)胞瘤、乳腺癌、鼻咽癌、尿路上皮癌等腫瘤的進(jìn)展密切相關(guān)。研究表明,在鼻咽癌細(xì)胞中EMP1 可以誘導(dǎo)細(xì)胞凋亡并阻止血管生成,從而阻斷癌細(xì)胞的生長和遷移〔18〕。在乳腺癌中也觀察到小葉癌、高度惡性的乳腺癌與導(dǎo)管癌相比,EMP1 表達(dá)水平顯著升高〔19〕。此外,EMP1 還與NSCLC 患者的吉非替尼耐藥性相關(guān)〔20~22〕。Ahmat-Amin 等〔23〕研究發(fā)現(xiàn)EMP1 的細(xì)胞內(nèi)結(jié)構(gòu)域直接與copine-Ⅲ結(jié)合,從而觸發(fā)由蛋白酪氨酸激酶Src 和Rac 鳥嘌呤核苷酸交換因子Vav2 介導(dǎo)的細(xì)胞內(nèi)信號(hào)級(jí)聯(lián)反應(yīng),以激活小GTPase Rac1,從而增強(qiáng)細(xì)胞遷移和侵襲性?;谝延醒芯靠芍?HLF、F10 和EMP1 在多種癌癥的進(jìn)展中均有表達(dá)。
綜上,LASSO 和SVM-RFE 算法的結(jié)合使篩選的基因更具有特征性,但本研究仍存在不足之處,如僅對(duì)數(shù)據(jù)庫的分析無法具有代表性。因此,在后續(xù)的研究中還需要對(duì)大量患者進(jìn)行進(jìn)一步的研究驗(yàn)證。