羅志鵬 苗志國(guó) 金瑞日 魏海云
1.江西省腫瘤醫(yī)院腹部腫瘤外科,江西南昌 330029;2.南昌大學(xué)第一附屬醫(yī)院消化內(nèi)科,江西南昌 330006
胃癌是消化系統(tǒng)常見(jiàn)惡性腫瘤之一,首診多為進(jìn)展期,預(yù)后較差,且生存期短[1]。胃癌個(gè)體差異大,同一分期預(yù)后也不盡相同,目前臨床常用的腫瘤標(biāo)志物不能準(zhǔn)確反映患者預(yù)后,尋找更多的生物標(biāo)志物來(lái)協(xié)助預(yù)測(cè)胃癌患者預(yù)后具有重要意義。自噬是通過(guò)與溶酶體融合吞噬分解細(xì)胞質(zhì)蛋白或細(xì)胞器,達(dá)到細(xì)胞代謝及更新細(xì)胞器的目的[2],為體內(nèi)重要的生物學(xué)過(guò)程,研究顯示很多腫瘤的病理過(guò)程中都有自噬參與[3-4]。自噬還可能和腫瘤耐藥有關(guān)[5],因此進(jìn)一步明確自噬在腫瘤中的作用對(duì)提高腫瘤的診療水平有較大的幫助。目前,基于自噬相關(guān)基因(autophagy relative genes,ARGs)構(gòu)建的預(yù)后模型已經(jīng)應(yīng)用于多種癌癥[6-7],但關(guān)于胃癌ARGs預(yù)后模型仍較少。本研究通過(guò)多種數(shù)據(jù)庫(kù)篩選得到胃癌ARGs,并應(yīng)用COX及Lasso分析得到與胃癌患者預(yù)后相關(guān)的關(guān)鍵ARGs,建立預(yù)后預(yù)測(cè)模型,為胃癌患者提供新的預(yù)后預(yù)測(cè)方法。
從人類(lèi)自噬數(shù)據(jù)庫(kù)(HADb,http: //autophagy. lu/clustering/index.html)和GSEA分子特征數(shù)據(jù)庫(kù)(MSigDB,http//software. broadinstitute.org/gsea/msigdb)中獲得805個(gè)ARGs。
下載腫瘤基因組圖譜數(shù)據(jù)庫(kù)(TCGA,https: //portal.gdc.cancer.gov/)中STAD格 式 的RNAseq數(shù)據(jù)轉(zhuǎn)錄組和臨床數(shù)據(jù)。共有407個(gè)胃癌樣本的基因表達(dá)數(shù)據(jù)。胃癌患者的臨床信息使用R語(yǔ)言軟件的“TCGAbiolinks”包獲得.應(yīng)用R語(yǔ)言軟件通過(guò)GEOquery包從gene expression omnibus數(shù) 據(jù) 庫(kù)(GEO,https: //www.ncbi.nlm.nih.gov/geo)中下載GSE54129數(shù)據(jù)。剔除無(wú)預(yù)后信息患者的數(shù)據(jù)。
應(yīng)用通過(guò)GEOquery包從GEO數(shù)據(jù)庫(kù)中下載GSE54129,總共有132例樣本,分為正常胃組織(21例)和胃癌組織(111例)。通過(guò)箱式圖查看樣本標(biāo)準(zhǔn)化的情況,通過(guò)PCA圖以及UMAP圖查看樣本分組間聚類(lèi)情況,利用limma包進(jìn)行兩組的差異分析。獲取的差異基因與自噬相關(guān)基因取交集,進(jìn)行進(jìn)一步分析。利用R軟件的“clusterprofiler”“org.HS.eg.7db”包進(jìn)行基因組本體(GO)功能富集解析(生物學(xué)步驟、細(xì)胞成分和分子作用)。利用日本京都基因百科全書(shū)(KEGG)分析可能有關(guān)的信號(hào)通路。
利用Lasso回歸分析獲取與胃癌患者預(yù)后相關(guān)性更高的ARGs結(jié)果。將標(biāo)準(zhǔn)化回歸系數(shù)不為零的基因組再納入多因素COX分析,從而形成了最終的預(yù)后風(fēng)險(xiǎn)評(píng)價(jià)模式。獲取與患者預(yù)后相關(guān)的關(guān)鍵ARGs,并通過(guò)Lasso回歸的風(fēng)險(xiǎn)因子數(shù)據(jù),使用R軟件繪制風(fēng)險(xiǎn)因子圖像。將胃癌患者的生命信號(hào)和不同表達(dá)的自噬差異基因整合到一起。同時(shí)對(duì)篩選出的基因進(jìn)行KM生存曲線分析。
基于多因素COX回歸分析結(jié)果篩選出獨(dú)立的預(yù)后參數(shù)用于建立列線圖,rms包和survival包估計(jì)1、3、5年內(nèi)總生存期(overall survival,OS)概率,并繪制校準(zhǔn)曲線,以評(píng)價(jià)模型的可行性。
采用R軟件進(jìn)行數(shù)據(jù)分析,采用Kaplan-Meier法繪制生存曲線并計(jì)算生存率,采用Log-Rank方法比較患者的生存狀況。P< 0.05為差異有統(tǒng)計(jì)學(xué)意義。
比較GSE54129數(shù)據(jù)中,正常組織(21例)和胃癌組織(111例)的基因表達(dá),得到2583個(gè)差異表達(dá)的基因,其中有1134個(gè)基因在胃癌組織中高表達(dá),1449個(gè)基因在胃癌中低表達(dá)。差異基因與805個(gè)自噬基因相交集,獲得102個(gè)自噬基因和胃癌相關(guān),見(jiàn)圖1。
圖1 胃癌ARGs韋恩圖
通過(guò)GO功能富集和KEGG信號(hào)通路分析得出ARGs可能和以下基因集有關(guān),見(jiàn)表1。
表1 差異表達(dá)的胃癌ARGs GO功能富集和KEGG信號(hào)通路分析
在TCGA數(shù)據(jù)庫(kù)中,通過(guò)Lasso回歸分析102個(gè)ARGs(篩 選 條 件為L(zhǎng)asso_coef>0)發(fā) 現(xiàn)CXCR4、DYNC1I1、RNASE1、SERPINE1可能與胃癌患者的預(yù)后相關(guān),見(jiàn)圖2。
圖2 Lasso篩選胃癌ARGs和交叉驗(yàn)證結(jié)果
通過(guò)多因素COX回歸分析篩出DYNC1I1、RNASE1兩個(gè)風(fēng)險(xiǎn)基因(P< 0.05),見(jiàn)表2;篩選出基因低表達(dá)的患者較高表達(dá)患者具有更長(zhǎng)的生存期,見(jiàn)圖3。模型有相對(duì)較好的預(yù)測(cè)能力。
表2 多因素COX回歸分析
圖3 DYNC1I1、RNASE1生存曲線分析
根據(jù)諾莫列線圖得出的C值越接近1,說(shuō)明列線圖的預(yù)測(cè)能力越準(zhǔn)確,見(jiàn)圖4。本研究構(gòu)建的預(yù)測(cè)模型C值為0.68,表示該模型具有較好的預(yù)測(cè)能力。通過(guò)分析DYNC1I1、RNASE1預(yù)后相關(guān)列線圖和列線圖的內(nèi)部校正曲線,可以看出術(shù)后1、3年具有較好的預(yù)測(cè)效果,術(shù)后5年的效果略差,可能與胃癌術(shù)后5年生存期偏低,樣本量較少有關(guān),見(jiàn)圖5。
圖4 構(gòu)建胃癌獨(dú)立危險(xiǎn)因素列線圖模型
圖5 術(shù)后1、3、5年OS的預(yù)后列線圖校準(zhǔn)曲線對(duì)模型預(yù)測(cè)準(zhǔn)確性進(jìn)行評(píng)價(jià)
進(jìn)展期胃癌治療效果差,盡管阿帕替尼、曲妥珠單抗及程序性死亡蛋白-1(programmed death-1,PD-1)等治療手段可以使部分患者生存期延長(zhǎng),但胃癌總體生存期仍處于較低水平[8-10]。目前鉑類(lèi)仍是胃癌的一線治療用藥,鉑耐藥是胃癌治療效果較差的一個(gè)重要因素,在其他癌癥中發(fā)現(xiàn)鉑耐藥可能與自噬有關(guān)[11]。自噬影響胃癌預(yù)后的作用機(jī)制值得探究?;贏RGs表達(dá)的預(yù)后模型現(xiàn)已應(yīng)用于肺癌、膽管癌、腸癌、乳腺癌等[12-14]。但在胃癌中的應(yīng)用較少,本研究通過(guò)多種數(shù)據(jù)庫(kù)篩選得到102個(gè)胃癌ARGs,利用GO功能富集,KEGG進(jìn)行信號(hào)通路分析發(fā)現(xiàn),差異表達(dá)的ARGs主要和自噬、阿米巴病、p53信號(hào)通路、癌癥中的蛋白多糖、糖尿病代謝中的Age-rage通路等相關(guān)。應(yīng)用Lasso回歸模型分析篩選出4個(gè)ARGs可能與胃癌預(yù)后相關(guān),進(jìn)一步使用多變量COX比例風(fēng)險(xiǎn)回歸分析,得到DYNC1I1、RNASE1兩個(gè)基因,建立了胃癌預(yù)后ARGs風(fēng)險(xiǎn)預(yù)測(cè)模型,提示DYNC1I1、RNASE1與胃癌患者預(yù)后密切相關(guān),并分析了其對(duì)胃癌患者術(shù)后1、3、5年生存期的影響,其中術(shù)后1、3年具有較好的預(yù)測(cè)效果,術(shù)后5年的效果略差,可能與胃癌術(shù)后5年生存期偏低,樣本量較少有關(guān)。
目前對(duì)于DYNC1I1在腫瘤中的作用研究較多,其可能參與了腫瘤細(xì)胞的自噬、凋亡、鉑耐藥等生物學(xué)過(guò)程。DYNC1I1可以促進(jìn)胃癌細(xì)胞增殖,抑制凋亡;DYNC1I1通過(guò)上調(diào)白介素-6的表達(dá)促進(jìn)胃癌的增殖和遷移[15-16],Zhou等[17]認(rèn)為DYNC1I1可以作為肝細(xì)胞癌患者的預(yù)后預(yù)測(cè)指標(biāo)。RNASE1同樣參與了很多病理過(guò)程,Cabrera-Fuentes等[18]認(rèn)為RNASE1可以防止細(xì)胞外RNA和腫瘤壞死因子-α在心肌缺血、再灌注損傷中的相互破壞作用;對(duì)心肌缺血具有保護(hù)作用;雖然RNASE1在腫瘤中的研究較少,但馬平川等[19]在其RNA結(jié)合蛋白相關(guān)預(yù)后模型的建立中提示RNASE1對(duì)于胃癌預(yù)后有較好的預(yù)測(cè)效果。Peracaula等[20]報(bào)道RNASE1對(duì)于早期胰腺癌也有提示作用。目前對(duì)于這些ARGs在胃癌中的作用仍然了解有限,自噬如何影響胃癌預(yù)后的分子機(jī)制尚需進(jìn)一步研究。
綜上所述,通過(guò)篩選胃癌ARGs,本研究成功構(gòu)建了基于DYNC1I1、RNASE1的胃癌預(yù)后預(yù)測(cè)模型,該模型具有較好的預(yù)測(cè)能力。對(duì)于提高臨床預(yù)后,尋找新的治療靶點(diǎn)有一定的參考意義。