張?jiān)?,曹慶飛,佟明
(錦州醫(yī)科大學(xué)附屬第一醫(yī)院,遼寧 錦州 121000)
腎細(xì)胞癌(renal cell carcinoma,RCC)是世界上最常見的泌尿系腫瘤之一,約占所有成人惡性腫瘤的3%。美國(guó)癌癥協(xié)會(huì)估計(jì),2020年美國(guó)將出現(xiàn)新增腎癌和腎盂癌病例73 750例,死亡14 830例[1]。腎透明細(xì)胞癌(clear cell renal carcinoma,ccRCC)是腎癌最常見的亞型,在腎癌所有的組織學(xué)類型中約占75%[2],也是腎癌死亡的主要原因[3]。早期局限性腎透明細(xì)胞癌經(jīng)治療后預(yù)后良好,5年生存率大于90%[4],可一旦發(fā)生遠(yuǎn)處轉(zhuǎn)移,生存期大幅縮短,發(fā)生骨轉(zhuǎn)移后平均生存時(shí)間為12~28個(gè)月[5]。由于30%~50%的腎透明細(xì)胞癌患者早期缺乏臨床癥狀,約有20%~30%的患者在初次診斷時(shí)就發(fā)現(xiàn)存在遠(yuǎn)處轉(zhuǎn)移[6-7],因此早期準(zhǔn)確診斷對(duì)腎透明細(xì)胞癌患者至關(guān)重要。隨著高通量測(cè)序技術(shù)的發(fā)展,越來越多的新的生物標(biāo)志物被發(fā)現(xiàn)與癌癥患者的生存預(yù)后相關(guān),尋找新的可靠的生物標(biāo)志物有助于腎透明細(xì)胞癌早期診斷、估計(jì)預(yù)后及指導(dǎo)治療。
VI型膠原是一種主要的細(xì)胞外基質(zhì)(extracellular matrix,ECM)蛋白,它與其他細(xì)胞外基質(zhì)分子相互作用,形成微絲網(wǎng)狀,為細(xì)胞提供結(jié)構(gòu)支撐[8]。既往研究表明膠原蛋白VI可以通過觸發(fā)信號(hào)通路調(diào)節(jié)細(xì)胞凋亡[9]、炎癥[10],甚至促進(jìn)腫瘤進(jìn)展[11]。膠原蛋白VI由不同基因編碼的3條主要多肽鏈(分別為α1、α2和α3)組成。COL6A1基因編碼的是α1多肽鏈,通常參與腫瘤轉(zhuǎn)移。有研究顯示下調(diào)COL6A1表達(dá)能夠抑制肺癌細(xì)胞轉(zhuǎn)移,而過表達(dá)COL6A1則能促進(jìn)肺癌細(xì)胞轉(zhuǎn)移[12]。一項(xiàng)全球分泌蛋白質(zhì)組分析結(jié)果顯示,高表達(dá)COL6A1可以促進(jìn)體內(nèi)腫瘤細(xì)胞骨轉(zhuǎn)移[13]。 然而,在腎透明細(xì)胞癌中COL6A1的臨床意義和預(yù)后價(jià)值仍然未知。
本研究旨在通過對(duì)癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫(kù)中腎透明細(xì)胞癌樣本數(shù)據(jù)進(jìn)行生物信息學(xué)分析,探討COL6A1表達(dá)在腎透明細(xì)胞癌中的預(yù)后價(jià)值。同時(shí),我們利用基因集富集分析(gene set enrichment analysis,GSEA)探索了COL6A1 高表達(dá)表型和低表達(dá)表型中關(guān)鍵信號(hào)通路的差異。
從TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/repository)下載腎透明細(xì)胞癌基因表達(dá)數(shù)據(jù)(共611例樣本;539例腎透明細(xì)胞癌組織樣本和72例正常的癌旁非癌組織樣本;工作流類型:HTSeq-FPKM)以及相關(guān)的臨床資料。相關(guān)的臨床資料包括年齡、性別、病理分級(jí)、TNM分期和臨床分期。部分臨床資料缺失的樣本不納入統(tǒng)計(jì)。
利用R語(yǔ)言的生存包建立包含年齡、病理分級(jí)、臨床分期、TNM分期、COL6A1表達(dá)的預(yù)后模型來預(yù)測(cè)腎透明細(xì)胞癌患者3年和5年的生存率。采用一致性指數(shù)(c-index)、校準(zhǔn)曲線和ROC曲線評(píng)價(jià)模型性能。
將KEGG基因集數(shù)據(jù)和表型標(biāo)簽文件(COL6A1-high和COL6A1-low)上傳至GSEA軟件。我們對(duì)每個(gè)分析進(jìn)行1000次基因集排列,將正常P< 0.05和FDR< 0.25的基因集定義為顯著差異表達(dá)的基因集。
所有數(shù)據(jù)均使用R軟件(V3.6.0; https://www.r-project.org/)進(jìn)行分析。采用Wilcoxon秩和檢驗(yàn)分析COL6A1 在腎透明細(xì)胞癌組和正常組中的表達(dá)差異。使用Wilcoxon符號(hào)秩檢驗(yàn)分析腎透明細(xì)胞癌及配對(duì)鄰近組織中COL6A1的表達(dá)差異。使用Wilcoxon秩和檢驗(yàn)、Kruskal-Wallis檢驗(yàn)評(píng)估臨床及病理因素和COL6A1表達(dá)之間的關(guān)系。采用Kaplan-Meier法分析COL6A1 表達(dá)和患者總生存時(shí)間之間的關(guān)系。采用Cox回歸分析COL6A1表達(dá)及其他臨床特征與總生存時(shí)間的關(guān)系。
分析比較539例腎透明細(xì)胞癌組織和72例癌旁非癌組織中COL6A1的表達(dá),發(fā)現(xiàn)COL6A1在腫瘤組織中的表達(dá)顯著高于正常組織(P<0.001),見圖1A。同時(shí),我們分析了COL6A1在72對(duì)配對(duì)腎透明細(xì)胞癌組織及癌旁非癌組織中的表達(dá),COL6A1在腎透明細(xì)胞癌組織中表達(dá)顯著高于癌旁非癌組織(P<0.001),見圖1B。
圖1 COL6A1在腫瘤組織中的表達(dá)顯著高于癌旁正常組織
TCGA數(shù)據(jù)庫(kù)中收集并整理患者的臨床及病理資料,見表1。包括年齡、性別、病理分級(jí)、TNM分期和臨床分期。采用Wilcoxon秩和檢驗(yàn)、Kruskal-Wallis檢驗(yàn)分析COL6A1表達(dá)量與臨床病理特征之間的關(guān)系,結(jié)果顯示COL6A1表達(dá)量與患者性別、M分期無(wú)關(guān),與年齡、病理分級(jí)、T分期、N分期、臨床分期顯著相關(guān),見圖2~3。
表1 從TCGA獲取的腎透明細(xì)胞癌患者的臨床信息
圖2 COL6A1表達(dá)量與腎透明細(xì)胞癌患者年齡、性別、病理分級(jí)、臨床分期之間的關(guān)系
Kaplan-Meier生存分析結(jié)果顯示,COL6A1高表達(dá)與患者不良預(yù)后相關(guān)(P=0.007),見圖4,即COL6A1高表達(dá)患者的總生存時(shí)間較低表達(dá)患者短。COL6A1高表達(dá)組的中位生存時(shí)間為66個(gè)月,而低表達(dá)組直到隨訪時(shí)間截止,死亡人數(shù)都沒有超過總?cè)藬?shù)的50%。為了進(jìn)一步分析COL6A1以及其他臨床病理因素對(duì)總生存時(shí)間的影響,我們進(jìn)行了Cox回歸分析。單因素Cox回歸分析結(jié)果顯示,COL6A1表達(dá)量、年齡、病理分級(jí)、臨床分期、TNM分期與總生存時(shí)間顯著相關(guān)(P<0.05),隨后,將這些因素作為自變量進(jìn)行多因素Cox回歸分析,結(jié)果顯示年齡、M分期、COL6A1表達(dá)量仍然與總生存時(shí)間密切相關(guān)(P<0.001),見圖5。說明COL6A1高表達(dá)、年齡、M分期是腎透明細(xì)胞癌患者不良預(yù)后的獨(dú)立危險(xiǎn)因素。
圖4 Kaplan-Meier生存分析結(jié)果顯示COL6A1高表達(dá)患者的總生存時(shí)間較低表達(dá)患者短
圖5 多因素Cox回歸分析結(jié)果顯示COL6A1高表達(dá)、年齡、M分期是影響腎透明細(xì)胞癌患者總生存時(shí)間的獨(dú)立危險(xiǎn)因素
為了預(yù)測(cè)腎透明細(xì)胞癌患者的3年和5年生存率,我們制作了一個(gè)包含年齡、病理分級(jí)、臨床分期、T分期、N分期、M分期和COL6A1 表達(dá)量的預(yù)后模型,見圖6。在這個(gè)預(yù)后模型中,每個(gè)因素都按其對(duì)生存率的風(fēng)險(xiǎn)貢獻(xiàn)比例被分配了分?jǐn)?shù),總分越高,總生存率越低。該預(yù)后模型的一致性指數(shù)(C指數(shù))為0.768。為了進(jìn)一步評(píng)價(jià)該預(yù)后模型的準(zhǔn)確性,我們繪制了預(yù)測(cè)校準(zhǔn)曲線和受試者工作特性(ROC)曲線。結(jié)果顯示,預(yù)測(cè)校準(zhǔn)曲線貼近標(biāo)準(zhǔn)曲線,見圖7。3年和5年生存率的ROC曲線下面積(AUC)分別為0.827和0.802,見圖8。說明該預(yù)后模型預(yù)測(cè)的3年和5年生存率與實(shí)際基本相符。
圖6 腎透明細(xì)胞癌患者總生存期的預(yù)后模型
圖7 預(yù)測(cè)模型的校準(zhǔn)曲線
圖8 預(yù)測(cè)模型的ROC曲線
為了探究腎透明細(xì)胞癌中與COL6A1高表達(dá)相關(guān)的信號(hào)通路,我們將從TCGA數(shù)據(jù)庫(kù)中收集到的樣本根據(jù)COL6A1表達(dá)量分為COL6A1高表達(dá)組和COL6A1低表達(dá)組進(jìn)行基因集富集分析。結(jié)果顯示,ECM受體相互作用、JAK STAT信號(hào)通路、MAPK 信號(hào)通路、NOTCH信號(hào)通路、p53信號(hào)通路、VEGF信號(hào)通路、WNT信號(hào)通路中基因集被富集到COL6A1高表達(dá)表型,見圖9。
細(xì)胞外基質(zhì)為調(diào)節(jié)細(xì)胞生長(zhǎng)和凋亡提供了必要的信號(hào),同時(shí)它還可以通過調(diào)節(jié)化療的途徑和形成促進(jìn)耐藥性的物理屏障來影響腫瘤對(duì)抗癌藥物的反應(yīng)[14]。膠原蛋白是細(xì)胞外基質(zhì)的主要蛋白之一,其中膠原蛋白VI在細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞遷移中發(fā)揮重要作用[13,15-16]1339-1355,并與一系列ECM組分相互作用[17]。COL6A1是脊椎動(dòng)物中的保守基因/蛋白,存在于所有結(jié)締組織中[18],主要編碼膠原蛋白VI的α1鏈,被發(fā)現(xiàn)在星形細(xì)胞瘤中差異表達(dá)[19]。根據(jù)全球分泌蛋白質(zhì)組分析,Blanco等[13,20]1339-1355研究發(fā)現(xiàn)COL6A1是一種新型的骨轉(zhuǎn)移介質(zhì)。但是,沒有研究報(bào)道COL6A1在腎透明細(xì)胞癌中的表達(dá)與臨床預(yù)后之間的關(guān)系。
在本研究中,我們利用生物信息學(xué)的方法分析了從TCGA數(shù)據(jù)庫(kù)中獲得的高通量RNA測(cè)序數(shù)據(jù)。結(jié)果顯示COL6A1在腎透明細(xì)胞癌中高表達(dá)與晚期臨床病理特征(高病理分級(jí)、高T分期、淋巴結(jié)轉(zhuǎn)移、高臨床分期)相關(guān)。Kaplan-Meier曲線顯示,COL6A1高表達(dá)患者總生存時(shí)間明顯少于低表達(dá)患者。多因素Cox回歸分析顯示,年齡、M分期以及COL6A1高表達(dá)是腎透明細(xì)胞癌患者預(yù)后不良的獨(dú)立風(fēng)險(xiǎn)因素。
隨著高通量測(cè)序技術(shù)的應(yīng)用,越來越多的研究發(fā)現(xiàn)分子的異質(zhì)性與腎透明細(xì)胞癌患者的預(yù)后與生存相關(guān)[21-22],所以只利用臨床病理特征這些傳統(tǒng)的指標(biāo)預(yù)測(cè)腎透明細(xì)胞癌患者的生存率是不夠充分的。因此我們建立了一個(gè)包含患者臨床病理特征(年齡、病理分級(jí)、臨床分期、TNM分期)和COL6A1表達(dá)量的預(yù)測(cè)模型來預(yù)測(cè)腎透明細(xì)胞癌患者3年和5年生存率,為臨床醫(yī)生提供了一個(gè)更加精確的定量工具來估計(jì)腎透明細(xì)胞癌患者的生存率。且C指數(shù)、預(yù)測(cè)校準(zhǔn)曲線及ROC曲線均證明該預(yù)測(cè)模型與實(shí)際基本相符。
為了進(jìn)一步探究COL6A1在腎透明細(xì)胞癌中潛在的分子生物學(xué)機(jī)制,我們通過基因集富集分析(GSEA)發(fā)現(xiàn)ECM受體相互作用、JAK STAT信號(hào)通路、MAPK 信號(hào)通路、NOTCH信號(hào)通路、p53信號(hào)通路、VEGF信號(hào)通路、WNT信號(hào)通路中基因集被富集到COL6A1高表達(dá)表型。我們推測(cè)這些信號(hào)通路與COL6A1相互作用,參與了腎透明細(xì)胞癌發(fā)生發(fā)展的過程,但是需要進(jìn)一步實(shí)驗(yàn)驗(yàn)證。
雖然本研究證實(shí)了COL6A1高表達(dá)與腎透明細(xì)胞癌患者預(yù)后之間的關(guān)系,但是本文仍有一些不足之處。第一,本文的數(shù)據(jù)是從TCGA數(shù)據(jù)庫(kù)得到的mRNA表達(dá)量,Guo等人[23]發(fā)現(xiàn)用mRNA的表達(dá)代表蛋白的表達(dá)是不夠完美的,本文并沒有討論COL6A1 mRNA表達(dá)與COL6A1蛋白表達(dá)的相關(guān)性。第二,本研究數(shù)據(jù)從單一腫瘤數(shù)據(jù)庫(kù)中獲得,存在選擇偏倚。第三,本文并沒有探討更深層的分子機(jī)制。
綜上所述,我們利用生物信息學(xué)進(jìn)行數(shù)據(jù)挖掘分析發(fā)現(xiàn)COL6A1高表達(dá)是腎透明細(xì)胞癌不良預(yù)后的獨(dú)立危險(xiǎn)因素,并且在腎透明細(xì)胞癌中ECM受體相互作用、JAK STAT信號(hào)通路、MAPK 信號(hào)通路、NOTCH信號(hào)通路、p53信號(hào)通路、VEGF信號(hào)通路、wnt信號(hào)通路可能與COL6A1相互作用促進(jìn)腎透明細(xì)胞癌的發(fā)生發(fā)展。