馬俊杰,安韶光,梅靜宇,張磊,張浩軒,陸進(jìn)
(蚌埠醫(yī)學(xué)院 1. 臨床醫(yī)學(xué)院2020級(jí); 2. 檢驗(yàn)醫(yī)學(xué)院2019級(jí); 3. 第二附屬醫(yī)院腫瘤外科; 4. 基礎(chǔ)醫(yī)學(xué)院人體解剖學(xué)教研室,安徽 蚌埠 233030)
腎細(xì)胞癌 (renal cell carcinoma,RCC) 是泌尿生殖系統(tǒng)常見的惡性腫瘤之一,占成人腎臟腫瘤的85% 以上[1]。2020年RCC新發(fā)病例達(dá)43萬(wàn),死亡患者約18萬(wàn)例[2]。腎透明細(xì)胞癌 (kidney renal clear cell carcinoma,KIRC) 是RCC的主要組織學(xué)亞型,約占80%[3]。目前,對(duì)于早期KIRC患者,手術(shù)切除仍然是主要和最有效的治療方法,但發(fā)生遠(yuǎn)處轉(zhuǎn)移的KIRC患者手術(shù)和放化療效果不明顯,5年生存率<10%,且復(fù)發(fā)風(fēng)險(xiǎn)較高[4]。因此,挖掘KIRC的新型生物標(biāo)志物對(duì)于患者的診斷與治療具有積極作用。
拓?fù)洚悩?gòu)酶 Ⅱα (topoisomerase Ⅱα,TOP2A) 屬于DNA 解鏈因子,在細(xì)胞增殖、DNA 復(fù)制以及染色體濃縮和分離等多種生物學(xué)過(guò)程 (biological process,BP) 中發(fā)揮關(guān)鍵作用,其表達(dá)具有明顯的細(xì)胞周期依賴性[5]。TOP2A表達(dá)或結(jié)構(gòu)異常時(shí)可導(dǎo)致染色體不穩(wěn)定以及腫瘤的發(fā)生,如在卵巢癌和肺癌中TOP2A表達(dá)異常導(dǎo)致患者不良預(yù)后[6-7],但其在KIRC中的作用目前仍待商榷。因此,本研究旨在通過(guò)生物信息學(xué)方法分析TOP2A在KIRC中的表達(dá)、預(yù)后和免疫學(xué)等有關(guān)分子機(jī)制,為KIRC的診斷和治療探索新的生物分子標(biāo)志物。
KIRC單細(xì)胞測(cè)序數(shù)據(jù)來(lái)自基因表達(dá)綜合數(shù)據(jù)庫(kù) (Gene Expression Omnibus,GEO) GSE111360隊(duì)列的GSM3029087 (p87)、GSM3029088 (p88) 和GSM 3029091 (p91) 3個(gè)樣本,根據(jù)以下標(biāo)準(zhǔn)過(guò)濾樣本中的細(xì)胞和基因:(1) 基因表達(dá)量200~50 000;(2) 線粒體基因百分比<15%;(3) 表達(dá)基因數(shù)量200~5 000;(4) ≥3個(gè)細(xì)胞中表達(dá)的基因。其余分析所使用的數(shù)據(jù)均為各數(shù)據(jù)庫(kù)默認(rèn)來(lái)源。
TOP2A基因差異表達(dá)、臨床分期及總生存期(overall survival,OS) 的Kaplan-Meier (K-M) 曲線通過(guò)GEPIA (http://gepia.cancer-pku.cn/) 在線工具分析;TOP2A在正常腎組織和KIRC組織中的免疫組化結(jié)果應(yīng)用HPA數(shù)據(jù)庫(kù)進(jìn)行獲取。
單細(xì)胞測(cè)序數(shù)據(jù)通過(guò)R包“Seurat”進(jìn)行分析,首先通過(guò)NormalizeData函數(shù)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,再通過(guò)FindIntegrationAnchors函數(shù)對(duì)3個(gè)患者樣本識(shí)別錨點(diǎn)進(jìn)行整合,然后通過(guò)RunPCA函數(shù)計(jì)算數(shù)據(jù)的主成分,選取前20個(gè)主成分通過(guò)K-最鄰近分布進(jìn)行聚類分析,細(xì)胞類型根據(jù)標(biāo)記基因通過(guò)CellMarker數(shù)據(jù)庫(kù) (http://bio-bigdata.hrbmu.edu.cn/CellMarker/) 和文獻(xiàn)收集進(jìn)行注釋。
TOP2A基因表達(dá)與KIRC免疫細(xì)胞浸潤(rùn)水平之間的相關(guān)性通過(guò)TIMER2.0 (http://timer.cistrome.org/)分析;利用Sangerbox探究TOP2A基因表達(dá)與免疫和基質(zhì)評(píng)分的關(guān)系,利用GEPIA2021的EPIC算法分析CD8+T細(xì)胞 (cut-off=80%)、CD4+T細(xì)胞 (cut-off=60%)、B細(xì)胞 (cut-off=84%)、NK細(xì)胞 (cut-off=85%)、巨噬細(xì)胞 (cut-off=70%) 和調(diào)節(jié)T (Tregs) 細(xì)胞 (cut-off=50%)的浸潤(rùn)水平與KIRC患者OS的關(guān)系。
將TOP2A基因和患者的臨床特征納入Aclbi進(jìn)行單因素Cox回歸分析,將P< 0.05的因素納入模型進(jìn)行列線圖的構(gòu)建,并通過(guò)校準(zhǔn)曲線和受試者操作特征 (receiver operating characteristic,ROC) 曲線下面積 (area under the curve,AUC) 進(jìn)行驗(yàn)證。
通過(guò)STRING數(shù)據(jù)庫(kù)檢索TOP2A基因的200個(gè)相關(guān)表達(dá)基因。然后,通過(guò)GEPIA2.0篩選 TCGA-KIRC數(shù)據(jù)集中表達(dá)上調(diào)的基因 (logFC≥1且q<0.05) 和TOP2A相關(guān)基因,共得到586個(gè)表達(dá)上調(diào)基因 (以q值由小到大排序) 和1 000個(gè)TOP2A相關(guān)基因 (按相關(guān)性由大到小排序);最后,各取前200個(gè)基因進(jìn)行韋恩圖繪制,得到11個(gè)與TOP2A相關(guān)的基因。
將獲得的TOP2A及相關(guān)基因?qū)階clbi分析其相關(guān)性;然后,通過(guò) Sangerbox探究TOP2A及相關(guān)基因的基因本體論 (Gene Ontology,GO) 和京都基因與基因組數(shù)據(jù)庫(kù) (Kyoto Encyclopedia of Genes and Genomes,KEGG) 通路富集;最后,通過(guò)Sangerbox以KEGG通路基因集為參考,根據(jù)TOP2A基因表達(dá)中位值分為高、低表達(dá)組,對(duì)不同表達(dá)組進(jìn)行基因集富集分析 (gene set enrichment analysis,GSEA)。
將TOP2A及相關(guān)基因?qū)階clbi在線分析工具進(jìn)行LASSO回歸分析,將篩選出的基因進(jìn)行風(fēng)險(xiǎn)評(píng)分 (風(fēng)險(xiǎn)評(píng)分=基因表達(dá)量×系數(shù)) 計(jì)算,根據(jù)風(fēng)險(xiǎn)評(píng)分的中位值將患者分為高、低風(fēng)險(xiǎn)組進(jìn)行下游分析。
單細(xì)胞數(shù)據(jù)通過(guò)R4.2.1軟件進(jìn)行分析,其余分析為各數(shù)據(jù)庫(kù)默認(rèn)軟件。采用單向方差分析檢驗(yàn)TOP2A基因在KIRC和正常組織差異表達(dá),不同腫瘤分期表達(dá)采用F檢驗(yàn)比較差異,免疫細(xì)胞和上皮細(xì)胞差異表達(dá)采用Wilcoxon檢驗(yàn),采用K-M法和logrank檢測(cè)進(jìn)行生存分析,采用Spearman相關(guān)性分析基因表達(dá)與免疫細(xì)胞浸潤(rùn)的水平相關(guān)性;P< 0.05為差異有統(tǒng)計(jì)學(xué)意義。
TOP2A在KIRC組織中表達(dá)上調(diào),且TOP2A基因的表達(dá)水平隨患者臨床分期的增高而增加 (P<0.05,圖1A、1B)。TOP2A基因的高表達(dá)水平不利于患者的OS (圖1C);GSEA分析結(jié)果顯示,高表達(dá)的TOP2A主要富集在細(xì)胞周期、不匹配修復(fù)和孕酮介導(dǎo)的卵母細(xì)胞成熟等與細(xì)胞增殖相關(guān)通路 (圖1D)。同樣,HPA數(shù)據(jù)庫(kù)結(jié)果顯示,TOP2A在腎癌組織中的蛋白質(zhì)表達(dá)上調(diào) (圖1E)。
圖1 TOP2A差異表達(dá)、預(yù)后和GSEA分析Fig.1 TOP2A differential expression,prognosis and GSEA analysis
根據(jù)各聚類的標(biāo)記基因可將各細(xì)胞分為上皮細(xì)胞和免疫細(xì)胞2種類型 (圖2A、2B),且TOP2A基因在免疫細(xì)胞中的表達(dá)量高于上皮細(xì)胞 (圖2C)。
由于TOP2A基因主要在免疫細(xì)胞中表達(dá),進(jìn)一步對(duì)免疫細(xì)胞亞型進(jìn)行聚類。根據(jù)各亞型的標(biāo)記基因,共得到6種細(xì)胞類型 NK細(xì)胞、CD8+T細(xì)胞、常規(guī)T細(xì)胞、Tregs、B細(xì)胞和肥大細(xì)胞 (圖2D、2E)。TOP2A在多種免疫細(xì)胞中均有表達(dá) (圖2F)。
TIMER2.0數(shù)據(jù)庫(kù)對(duì)TOP2A基因表達(dá)與各免疫細(xì)胞浸潤(rùn)水平的相關(guān)性分析結(jié)果顯示,TOP2A與大多數(shù)免疫細(xì)胞浸潤(rùn)呈正相關(guān) (圖3A)。GEPIA2021數(shù)據(jù)庫(kù)結(jié)果顯示,CD8+T細(xì)胞和CD4+T細(xì)胞的高浸潤(rùn)水平與KIRC患者較好的預(yù)后相關(guān),而B細(xì)胞、巨噬細(xì)胞、NK細(xì)胞及Tregs細(xì)胞在KIRC高浸潤(rùn)水平均為KIRC患者預(yù)后的危險(xiǎn)因素 (圖3B)。
圖3 免疫細(xì)胞浸潤(rùn)水平與TOP2A基因表達(dá)及患者預(yù)后的關(guān)系Fig.3 Relationship between immune cell infiltration level and TOP2A gene expression and patient prognosis
將TOP2A及患者的臨床特征納入單因素Cox回歸分析,結(jié)果顯示,TOP2A基因可做為KIRC患者預(yù)后影響因素 (圖4A),TOP2A基因及患者臨床特征所構(gòu)建的列線圖可預(yù)測(cè)KIRC患者的1、3和5年的生存狀況,且隨著列線圖得分的增高,患者的生存率降低 (圖4B)。校準(zhǔn)曲線顯示其具有較好的預(yù)測(cè)準(zhǔn)確性 (圖4C),且1年AUC 為0.86、3年AUC為0.80、5年AUC為0.75,表明列線圖可良好地預(yù)測(cè)患者的生存狀況 (圖4D)。
TOP2A基因的相關(guān)基因進(jìn)行韋恩圖分析,共篩選出12個(gè)基因,且TOP2A基因及其相關(guān)基因的相關(guān)性較高 (圖5A)。對(duì)包括TOP2A在內(nèi)的12個(gè)基因進(jìn)行GO功能注釋和KEGG富集分析,結(jié)果顯示,其KEGG通路主要富集在細(xì)胞周期、p53信號(hào)通路和細(xì)胞衰老等 (圖5B);分子功能 (molecular function,MF) 主要包括腺苷酸結(jié)合、蛋白激酶活性和微管結(jié)合等;細(xì)胞構(gòu)成 (cellular component,CC) 主要包括微管細(xì)胞骨架、染色體和微管組織中心等;BP主要包括細(xì)胞周期相變的調(diào)節(jié)、微管細(xì)胞骨架組織和細(xì)胞器調(diào)節(jié)等 (圖5C)。
圖5 TOP2A及其相關(guān)基因的富集分析Fig.5 Enrichment analysis of TOP2A and its related genes
將TOP2A及其相關(guān)基因?qū)隠ASSO回歸模型進(jìn)行10倍交叉驗(yàn)證,得到最小λ值為0.013 8,篩選出包括TOP2A在內(nèi)的 9個(gè)特征基因,再根據(jù)基因表達(dá)量及相關(guān)系數(shù)構(gòu)建風(fēng)險(xiǎn)評(píng)分 (圖6A)。根據(jù)風(fēng)險(xiǎn)評(píng)分中位值將患者分為高、低風(fēng)險(xiǎn)組,結(jié)果顯示,隨著風(fēng)險(xiǎn)評(píng)分的增高患者的死亡率增高 (圖6B),與低風(fēng)險(xiǎn)組相比,高風(fēng)險(xiǎn)組的OS顯著縮短 (圖6C)。且該模型預(yù)測(cè)患者OS ROC的AUC值1年為0.685、3年為0.655以及5年為0.659,具有較好的預(yù)測(cè)能力 (圖6D)。
KIRC是目前腎臟惡性腫瘤中最常見的組織學(xué)亞型,由于腫瘤的高度異質(zhì)性,KIRC在不同患者中呈現(xiàn)多樣化的臨床表現(xiàn),且晚期患者對(duì)于常見的化療藥物敏感性不高[8-9]。因此,迫切需要新的分子標(biāo)志物評(píng)估患者臨床的治療和預(yù)后。目前,TOP2A已被證實(shí)與多種惡性腫瘤的進(jìn)展和不良預(yù)后有關(guān)[10-11]。但其在KIRC中的相關(guān)研究甚少。
TOP2A基因在KIRC組織中的表達(dá)顯著上調(diào),并且與患者的不良預(yù)后和臨床分期增高有關(guān)。此外,高表達(dá)的TOP2A主要富集在細(xì)胞周期和錯(cuò)配修復(fù)等過(guò)程,SMITH等[12]研究發(fā)現(xiàn)在腫瘤細(xì)胞由靜止期進(jìn)入細(xì)胞周期時(shí),TOP2A的合成激活促進(jìn)腫瘤細(xì)胞的增殖,這可能是其促進(jìn)腫瘤發(fā)生發(fā)展的原因之一。差異分析和富集分析結(jié)果顯示,TOP2A的表達(dá)可能與KIRC的發(fā)生、發(fā)展和轉(zhuǎn)移關(guān)系密切。
對(duì)KIRC患者的單細(xì)胞測(cè)序數(shù)據(jù)分析發(fā)現(xiàn),TOP2A基因在多種免疫細(xì)胞中表達(dá),且與多種免疫細(xì)胞浸潤(rùn)水平呈正相關(guān),與XU等[13]在腎乳頭狀細(xì)胞癌中的研究結(jié)果一致。不同的是在KIRC中,各免疫細(xì)胞的浸潤(rùn)水平長(zhǎng)期增高反而不利于患者的預(yù)后。研究[14]顯示,正常人體中CD4/CD8細(xì)胞比例處于特定的范圍,二者的比例失調(diào)可導(dǎo)致機(jī)體免疫功能的異常。此外,巨噬細(xì)胞和B細(xì)胞也可能由于其在腫瘤中被誘導(dǎo)產(chǎn)生不同分化表型導(dǎo)致腫瘤細(xì)胞的增殖或腫瘤免疫逃避的產(chǎn)生[15-16]。TOP2A的表達(dá)不僅有利于KIRC的發(fā)生與轉(zhuǎn)移,還可激活機(jī)體的免疫系統(tǒng)。腫瘤微環(huán)境是由腫瘤細(xì)胞與腫瘤間質(zhì)細(xì)胞、免疫細(xì)胞、細(xì)胞外基質(zhì)、血管組織和信號(hào)分子等相互作用形成的動(dòng)態(tài)系統(tǒng),各成分的相對(duì)比例改變也可能導(dǎo)致腫瘤侵襲性增高及患者的不良預(yù)后[17-18],這可能是TOP2A基因誘導(dǎo)KIRC患者不良預(yù)后的原因之一。
總之,本研究基于生物信息學(xué)方法探究了TOP2A基因在KIRC的表達(dá)和免疫浸潤(rùn)等有關(guān)分子機(jī)制,建立了預(yù)后風(fēng)險(xiǎn)模型,并應(yīng)用列線圖預(yù)測(cè)了TOP2A基因在KIRC中的有關(guān)預(yù)后作用,表明TOP2A可作為KIRC的預(yù)后分子標(biāo)志物,對(duì)臨床治療和預(yù)后提供參考。本研究還需要相關(guān)的基礎(chǔ)和臨床實(shí)驗(yàn)進(jìn)行驗(yàn)證,以便更加準(zhǔn)確地探究有關(guān)分子機(jī)制及預(yù)后意義。