劉一笑,受夢媛,張 瑩,張榮強(qiáng),孫 娜
(陜西中醫(yī)藥大學(xué)公共衛(wèi)生學(xué)院流統(tǒng)教研室,陜西 咸陽 712046)
惡性腫瘤是人類機(jī)體在各種致癌因素下,局部組織細(xì)胞異常增生并轉(zhuǎn)移擴(kuò)散至其他組織的一類疾病,2020 年全球新發(fā)癌癥病例約1 930 萬例,每4 個人中就會有1 人患有癌癥的風(fēng)險[1]。癌癥是世界范圍內(nèi)僅次于心臟病的第二大死亡原因[2],嚴(yán)重危害人類生命健康[3],給社會帶來了重大的健康和經(jīng)濟(jì)問題,隨著病例數(shù)量的持續(xù)增加,癌癥的負(fù)擔(dān)無疑會變得更加嚴(yán)重。
小凹蛋白-1(caveolin 1,CAV1)是細(xì)胞質(zhì)膜小凹中一種重要的結(jié)構(gòu)功能蛋白,結(jié)構(gòu)可分為3 個區(qū)域,包括C 端跨域、N 末端支架結(jié)構(gòu)和支架結(jié)構(gòu) 域(caveolin-scaffolding domain,CSD),其 中CSD 區(qū)域能特異性地與多種信號分子結(jié)合[4],成為多條信號通路的樞紐,影響細(xì)胞的增殖、遷移和分化并具有介導(dǎo)內(nèi)吞、胞吞、機(jī)械保護(hù)、細(xì)胞代謝和脂質(zhì)穩(wěn)態(tài)等豐富的功能[5]。CAV1 的廣泛分布也決定了其功能的重要性,研究學(xué)者[6-10]發(fā)現(xiàn)CAV1 與逆轉(zhuǎn)腫瘤耐藥細(xì)胞耐藥性有關(guān),下調(diào)CAV1 的表達(dá)使ERK(extracellular regulated protein kinases)通路激活會促進(jìn)黑色素瘤細(xì)胞的體內(nèi)體外增殖,敲低CAV1 表達(dá)可抑制肺腺癌H1299 細(xì)胞增殖、遷移和侵襲并影響其生物學(xué)行為,CAV1在膠質(zhì)瘤細(xì)胞中與ER-α36 相互作用共同參與腫瘤細(xì)胞生長;抑制CAV1 的活化和脂筏的聚集可以逆轉(zhuǎn)胃癌細(xì)胞的遷移[11];紹偉偉等認(rèn)為CAV1的表達(dá)與腫瘤患者的預(yù)后存在聯(lián)系[12],并有多項研究指出其與腫瘤的發(fā)生發(fā)展關(guān)系密切[13]。
目前,臨床上針對癌癥的治療主要包括手術(shù)、化療、放療、靶向治療和免疫治療[14],但由于耐藥、副作用等問題,患者的預(yù)后和生存率仍不令人滿意。因此,深入研究癌癥的生存預(yù)后靶點,為臨床治療提供新的方向和策略就顯得尤為重要。隨著近年來生物信息學(xué)技術(shù)和遺傳科學(xué)的發(fā)展,基因在各種腫瘤中的預(yù)后價值正在廣泛被探討,使用基因來識別、診斷和確定潛在腫瘤風(fēng)險成為可能。本研究以CAV1 基因為研究對象,基于多種數(shù)據(jù)庫探索該基因在人類腫瘤組織中的mRNA表達(dá)、蛋白表達(dá)、患者的預(yù)后、腫瘤免疫浸潤相關(guān)性、相似基因功能富集與Nomogram 模型建立與驗證,旨在揭示CAV1 在人類腫瘤發(fā)生發(fā)展過程中的影響,為其在腫瘤的預(yù)防、識別、診斷及其治療提供參考依據(jù)。
使 用 R 包:ggplot2[3.3.6]、stats[4.2.1]和car[3.1-0]分析經(jīng)Toil 流程[15]統(tǒng)一處理TCGA 數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA)和GTEx 數(shù)據(jù)庫(Genotype-Tissue Expression)中的TPM(transcripts per million reads)格式的RNAseq 數(shù)據(jù),并對TPM格式的RNAseq 數(shù)據(jù)進(jìn)行l(wèi)og2 轉(zhuǎn)化,利用Mann-Whitney U 檢驗(Wilcoxon rank sum test)分析CAV1基因在33 種不同正常組織和腫瘤組織中的mRNA差異表達(dá)水平。
使用UALCAN 數(shù)據(jù)庫(http://ualcan.path.uab.edu/analysis-prot.html)分析癌癥組學(xué)數(shù)據(jù),先將每個樣品譜內(nèi)歸一化,然后再樣品間歸一化,Z 值代表給定癌癥類型的樣本中值的標(biāo)準(zhǔn)差,對CPTAC(Clinical proteomic tumor analysis consortium)數(shù)據(jù)庫的11 種腫瘤進(jìn)行蛋白表達(dá)分析[16],比較CAV1在人類正常組織和腫瘤組織中的蛋白表達(dá)水平。
選擇TCGA 數(shù)據(jù)庫中mRNA 表達(dá)具有差異統(tǒng)計學(xué)意義的腫瘤臨床數(shù)據(jù),使用R 包:survival[3.3.1]進(jìn)行比例風(fēng)險假設(shè)檢驗并進(jìn)行擬合生存回歸,數(shù)據(jù)格式為TPM,預(yù)后參數(shù)類型選擇總生存期(overall survival,OS),使用單因素Cox 回歸分析計算比較患者樣本CAV1 表達(dá)高低組與患者生存之間的關(guān)系,利用survminer 包以及ggplot2 進(jìn)行結(jié)果可視化處理。
利用Mann-Whitney U 檢驗(Wilcoxon rank sum test)單獨分析CAV1 在具有生存預(yù)后意義的腫瘤表達(dá)差異,通過HPA(Human Protein Atlas)(http:www.proteinatlas.org/)數(shù)據(jù)庫下載TCGA 數(shù)據(jù)庫中CAV1在正常組織和腫瘤組織中的免疫組織染色圖,并對進(jìn)行分析。
基于R 包-GSVA[1.46.0]中的ssGSEA 算法,利用Immunity 提供的24 種免疫細(xì)胞[17]的markers計算對應(yīng)的免疫浸潤數(shù)據(jù),主分子為CAV1,對數(shù)據(jù)中主變量的腫瘤和免疫浸潤矩陣數(shù)據(jù)之間進(jìn)行Spearman 相關(guān)性分析,分析結(jié)果用ggplot2 包進(jìn)行可視化。
從TCGA 數(shù)據(jù)庫(https://portal.gdc.cancer.gov)下載整理腫瘤項目STAR 流程的RNAseq 數(shù)據(jù)并提取TPM 格式的數(shù)據(jù)以及臨床數(shù)據(jù),剔除無效數(shù)據(jù)。以CAV1 基因表達(dá)數(shù)據(jù)與主要臨床信息參數(shù)作為自變量,以與CAV1 表達(dá)量具有生存預(yù)后意義的腫瘤總生存期(overall survival,OS)為因變量,進(jìn)行單因素與多因素COX 回歸模型,分析腫瘤總生存期的影響因素。使用R 軟件“rms”包構(gòu)建nomogram 相關(guān)模型并進(jìn)行可視化,利用校準(zhǔn)曲線對模型進(jìn)行驗證和評估。
通過對TCGA 和GTEx 數(shù)據(jù)庫CAV1 基因進(jìn)行分析,與正常組織相比,33 種腫瘤組織中有26 種mRNA 表達(dá)差異具有統(tǒng)計學(xué)意義(P<0.05),其中CAV1 基因在ACC 腎上腺皮質(zhì)癌(ACC)、膽管癌(CHOL)、彌漫性大B 細(xì)胞淋巴瘤(DLBC)、多形性成膠質(zhì)細(xì)胞癌(GBM)、頭頸鱗狀細(xì)胞癌(HNSC)、腎嫌色細(xì)胞癌(KICH)、腎透明細(xì)胞癌(KIRC)、急性髓性白血?。↙AML)、腦低級別膠質(zhì)癌(LGG)、肝臟肝細(xì)胞癌(LIHC)、胰腺癌(PAAD)、胸腺瘤(THYM)、12 種腫瘤組織中高表達(dá)(P<0.05);CAV1 基因在膀胱癌(BLCA)、乳腺癌(BRCA)、宮頸鱗癌(CESC)、結(jié)腸癌(COAD)、食管癌(ESCA)、肺腺癌(LUAD)、肺鱗癌(LUSC)、卵巢漿液性囊腺癌(OV)、前列腺癌(PRAD)、直腸腺瘤(READ)、皮膚黑色素瘤(SKCM)、THCA(甲狀腺癌)、子宮內(nèi)膜癌(UCEC)、子宮肉瘤(UCS)14 種腫瘤組織中呈現(xiàn)低表達(dá)(P<0.05),見圖1。
圖1 CAV1 基因在人類腫瘤組織和正常組織中的mRNA 表達(dá)分析Fig.1 mRNA expression analysis of CAV1 gene in human tumor tissues and normal tissues
從CPTAC 數(shù)據(jù)集獲得11 組蛋白質(zhì)差異表達(dá)數(shù)據(jù),結(jié)果表明:與正常組織相比,CPTAC 數(shù)據(jù)庫中CAV1 蛋白在結(jié)腸癌(COAD)、乳腺癌(BRCA)、頭頸鱗狀細(xì)胞癌(HNSC)、肝臟肝細(xì)胞癌(LIHC)、肺腺癌(LUAD)、肺鱗癌(LUSC)、卵巢漿液性囊腺癌(OV)、子宮內(nèi)膜癌(UCEC)這8種腫瘤組織中的表達(dá)降低,而在腎透明細(xì)胞癌(KIRC)中表達(dá)增高,差異均具有統(tǒng)計學(xué)意義(P<0.05),在多形性成膠質(zhì)細(xì)胞癌(GBM)、胰腺癌(PAAD)這2 種腫瘤中表達(dá),差異無統(tǒng)計學(xué)意義(P>0.05),見圖2。
圖2 CAV1 基因在不同癌癥組織和正常組織中的總蛋白表達(dá)分析Fig.2 Total protein expression analysis of CAV1 gene in different cancer tissues and normal tissues
TCGA 數(shù)據(jù)庫中分析CAV1 表達(dá)與mRNA 表達(dá)具有統(tǒng)計學(xué)差異的26 種腫瘤生存預(yù)后之間的相關(guān)性,結(jié)果顯示CAV1 只在BLCA(HR=1.49,95%CI[1.11~2.00]),LGG(HR=2.43,95%CI[1.67~3.54])和HNSC(HR=1.43,95%CI[1.09~1.87])中存在預(yù)后相關(guān),且差異均具有統(tǒng)計學(xué)意義(P<0.01),而與其他腫瘤預(yù)后相關(guān)無統(tǒng)計學(xué)意義。K-M 生存曲線結(jié)果顯示LGG、HNSC、BLCA這3 種腫瘤中的高表達(dá)組生存預(yù)后較低表達(dá)組更差,見圖3,提示CAV1 高表達(dá)是其危險因素,可能表現(xiàn)為促癌基因,因此CAV1 可能作為LGG、HNSC 和BLCA 患者預(yù)后的候選基因。
圖3 CAV1 基因在BLCA、LGG 與HNSC 腫瘤組織中的預(yù)后KM 曲線圖Fig.3 Prognostic KM curve of CAV1 gene in BLCA,LGG and HNSC tumors
通過對HPA 數(shù)據(jù)庫提供的免疫組化結(jié)果進(jìn)行分析,結(jié)果表明CAV1 在膀胱組織中低表達(dá),在BLCA 組織中高表達(dá),與其mRNA 基因表達(dá)結(jié)果相反。CAV1 在LGG 和HNSC 中免疫組化結(jié)果顯示CAV1 在大腦與頭頸部均低表達(dá),在LGG 與HNSC 中均高表達(dá),mRNA 表達(dá)結(jié)果與其免疫組化數(shù)據(jù)一致,IHC 染色均為中等或強(qiáng)染色,見圖4。
圖4 BLCA、LGG 和HNSC 腫瘤組織和正常組織的免疫組化圖(×100)Fig.4 Immunohistochemical maps of BLCA,LGG and HNSC tumor tissue and normal tissue(×100)
TCGA 數(shù)據(jù)庫中CAV1 在3 種具有生存預(yù)后意義的腫瘤與24 種免疫浸潤細(xì)胞數(shù)據(jù)的相關(guān)性結(jié)果顯示,CAV1 在LGG 中與21 種免疫浸潤細(xì)胞具有相關(guān)性,其中與Macrophages、Neutrophils等18 種免疫浸潤細(xì)胞表達(dá)呈正相關(guān),與Treg 細(xì)胞、pDC 細(xì)胞和NK CD56bright 細(xì)胞表達(dá)呈負(fù)相關(guān),與Mast 細(xì)胞、Tem 細(xì)胞和TFH 細(xì)胞表達(dá)無統(tǒng)計學(xué)意義,其中正相關(guān)最高的為Macrophages細(xì)胞(R=0.518),負(fù)相關(guān)最高的是NK CD56bright細(xì)胞(R=-0.248)。CAV1 在HNSC 中與14 種免疫浸潤細(xì)胞具有相關(guān)性,正負(fù)相關(guān)各有7 種,其中正相關(guān)最高的為Tgd 細(xì)胞(R=0.488),負(fù)相關(guān)最高的是B 細(xì)胞(R=-0.250)。CAV1 在BLCA 中與23 種免疫浸潤細(xì)胞具有相關(guān)性,其中正相關(guān)為21 種,與其負(fù)相關(guān)的細(xì)胞為Th17 細(xì)胞和NK CD56bright 細(xì)胞,與其無統(tǒng)計學(xué)意義的細(xì)胞為T helper 細(xì)胞,正相關(guān)最高的是Macrophages 細(xì)胞(R=0.629),負(fù)相關(guān)最高的是NK CD56bright 細(xì)胞(R=-0.339),見圖5。
圖5 CAV1 基因在3 種不同腫瘤組織中與免疫浸潤細(xì)胞相關(guān)性棒棒糖圖Fig.5 Lollipop map of CAV1 gene correlation with immunoinfiltrating cells in three different tumor tissues
單因素COX 回歸分析表明,CAV1 和年齡是BLCA 患者生存預(yù)后的危險因素且均具有統(tǒng)計學(xué)差異(P<0.05),多因素COX 回歸顯示年齡是影響B(tài)LCA 生存預(yù)后的獨立危險因素。CAV1 表達(dá)量與BLCA 臨床病例相關(guān)數(shù)據(jù)構(gòu)建Momogram 模型的一致性良好(Concordance,C-index=0.643,95%CI[0.619~0.668],多因素模型滿足比例風(fēng)險假設(shè)且不存在多重共線性(0<VIF<10),該模型校準(zhǔn)曲線穩(wěn)定,見圖6。
圖6 CAV1 表達(dá)對BLCA 總生存期的影響因素COX 回歸分析及其Nomogram 模型的構(gòu)建與評估Fig.6 COX regression analysis of influencing factors of CAV1 expression on overall survival of BLCA and Nomogram model construction and evaluation
單因素COX 回歸分析顯示,CAV1 與WHO grade 是LGG 患者生存預(yù)后的危險因素,均具有統(tǒng)計學(xué)意義(P<0.05),種族、病灶位置和性別均無統(tǒng)計學(xué)意義(P> 0.05);同時多因素COX 回歸分析表明CAV1 與WHO grade 是影響LGG 患者OS 的獨立危險因素,均具有統(tǒng)計學(xué)意義(P<0.05)。通過CAV1 表達(dá)量與LGG 臨床病例相關(guān)數(shù)據(jù)構(gòu)建的Nomogram 模型結(jié)果顯示,CAV1、WHO grade和年齡對LGG 患者的OS 具有良好效果,模型的一致性良好(Concordance,C-index=0.770),95%CI[0.748~0.792],多因素模型滿足比例風(fēng)險假設(shè),不存在多重共線性(0<VIF<10),該模型校準(zhǔn)曲線穩(wěn)定,見圖7。
單因素COX 回歸分析表明CAV1 和臨床病理分型是HNSC 患者生存預(yù)后的危險因素,均具有統(tǒng)計學(xué)差異(P<0.05),多因素COX 回歸分析顯示CAV1 與臨床病理分型是影響HNSC 患者OS 的獨立危險因素,均具有統(tǒng)計學(xué)差異(P<0.05)。基于CAV1 表達(dá)量與HNSC 患者臨床相關(guān)數(shù)據(jù)構(gòu)建的Nomogram 模型一致性良好一致性(Concordance,C-index=0.615),95%CI[0.592~0.638],滿足比例風(fēng)險假設(shè)且不存在多重共線性(0<VIF<10),該模型校準(zhǔn)曲線穩(wěn)定,見圖8。
圖8 CAV1 表達(dá)對HNSC 總生存期的影響因素COX 回歸分析及其Nomogram 模型的構(gòu)建與評估Fig.8 COX regression analysis of factors influencing CAV1 expression on HNSC overall survival and Nomogram model construction and evaluation
2020 年全球近1 000 萬人因腫瘤而死亡,腫瘤的高發(fā)病率和高死亡率嚴(yán)重威脅著人類的健康[18],現(xiàn)有的研究證實大多數(shù)環(huán)境致癌物并不能直接導(dǎo)致腫瘤的發(fā)生,需要先在人體內(nèi)激活活化并結(jié)合形成親電子中間產(chǎn)物才呈現(xiàn)致癌性[19],而基因異常表達(dá)是腫瘤發(fā)生的內(nèi)在因素[20],其與各種癌癥的發(fā)生發(fā)展存在一定聯(lián)系[21-24],從基因角度探索人類腫瘤的發(fā)生發(fā)展關(guān)系,對其生存預(yù)后的預(yù)測與治療進(jìn)行研究是重點。
CAV1 具有與多種信號分子相同的氨基酸序列,其表達(dá)量的差異會影響細(xì)胞的增殖與遷移[25],通過互補(bǔ)結(jié)合調(diào)控相關(guān)信號通路,形成樞紐中心,調(diào)控細(xì)胞分化、增殖與衰老,從而參與到腫瘤的形成過程中。生物學(xué)中蛋白質(zhì)合成是通過mRNA分子中堿基排列順序轉(zhuǎn)變或多肽鏈中的氨基酸排列組合形成的,本研究結(jié)果顯示,CAV1 基因在26 種腫瘤中mRNA 表達(dá)不同,且差異有統(tǒng)計學(xué)意義(P<0.05),CAV1 在HNSC 腫瘤組織中mRNA表達(dá)上調(diào),但在蛋白水平上卻顯示為低表達(dá),這有可能與mRNA 的翻譯調(diào)控或蛋白質(zhì)穩(wěn)定性有關(guān)[26]。
通過對TCGA 數(shù)據(jù)庫中CAV1 有差異表達(dá)結(jié)果的腫瘤與其OS 的相關(guān)性分析表明:CAV1 表達(dá)與BLCA、LGG 和HNSC 患者預(yù)后不良密切相關(guān),K-M 生存曲線顯示CAV1 的高表達(dá)不利于BLCA、LGG 和HNSC 患者的生存預(yù)后。mRNA 基因通過翻譯為蛋白質(zhì)進(jìn)而在人體內(nèi)行使復(fù)雜的生物學(xué)活動,通過HPA 數(shù)據(jù)庫對BLCA、LGG 和HNSC 及其正常組織進(jìn)行免疫組化分析發(fā)現(xiàn)CAV1 在BLCA 中的mRNA 表達(dá)與免疫組化結(jié)果相反,提示CAV1 在BLCA 患者中行使某些生物學(xué)功能表達(dá)與mRNA 表達(dá)有區(qū)別,不過這也可能與HPA數(shù)據(jù)庫中的組織樣本量較少有關(guān)。
免疫浸潤細(xì)胞能夠影響臨床治療療效及患者生存期長短[27]。CAV1 在BLCA、LGG 和HNSC這3 種腫瘤中與24 種免疫浸潤細(xì)胞具有緊密相關(guān)性且正相關(guān)較多,提示CAV1 參與了免疫反應(yīng)過程,可能是這3 種腫瘤患者生存預(yù)后的潛在免疫調(diào)節(jié)基因。單因素COX 回歸發(fā)現(xiàn)CAV1 均是BLCA、LGG 和HNSC 腫瘤患者生存預(yù)后的危險因素,其低表達(dá)可能會對這3 種腫瘤患者的不良預(yù)后具有一定的抑制效果。
綜上所述,本研究從多個角度探討了CAV1在人類腫瘤生存預(yù)后中的潛在價值,抑制CAV1在體內(nèi)的表達(dá)對惡性腫瘤的發(fā)生可能具有一定作用,CAV1 在多種腫瘤中 與正常組織有差異表達(dá),與BLCA、LGG、HNSC 患者的預(yù)后有關(guān)且在免疫調(diào)節(jié)中發(fā)揮著巨大作用。但同時也存在著一些局限性:(1)研究基于多個數(shù)據(jù)庫進(jìn)行分析,各個數(shù)據(jù)庫中存在的組織樣本數(shù)有一定差別,可能導(dǎo)致分析結(jié)果存在偏差;(2)未進(jìn)行實驗分析,缺乏體內(nèi)體外驗證。
本研究對CAV1 在人類腫瘤中的分析結(jié)果表明,CAV1 在BLCA、LGG 與HNSC 中可能是一個新的診斷、治療和預(yù)后標(biāo)志物基因,通過介導(dǎo)多條信號通路從而影響腫瘤的發(fā)生發(fā)展過程,為癌癥的臨床服務(wù)提供一定的理論基礎(chǔ)。