王 凱 費(fèi)素娟
作者單位:221002 徐州醫(yī)科大學(xué)第一臨床醫(yī)學(xué)院(王 凱);221004 徐州醫(yī)科大學(xué)附屬醫(yī)院(費(fèi)素娟)
根據(jù)相關(guān)資料顯示,胃癌的發(fā)病率在全球惡性腫瘤中排在第5位,死亡率排在第3位[1],在我國(guó)更為多見(jiàn)。雖然對(duì)治療方案進(jìn)行了不斷的優(yōu)化,但是患者的 5 年生存率仍然較低[1]。本文通過(guò)構(gòu)建一個(gè)免疫相關(guān)基因預(yù)后風(fēng)險(xiǎn)模型來(lái)評(píng)估胃癌患者的預(yù)后情況,一定程度上有利于患者的早期診斷、病程進(jìn)展、個(gè)體化治療。目前認(rèn)為,免疫微環(huán)境影響腫瘤發(fā)生、發(fā)展、轉(zhuǎn)移及耐藥,腫瘤浸潤(rùn)淋巴細(xì)胞可用來(lái)評(píng)估腫瘤患者復(fù)發(fā)及死亡風(fēng)險(xiǎn)。免疫治療是一種新穎的對(duì)抗腫瘤的治療方法,通過(guò)機(jī)體自身的免疫功能,控制與清除腫瘤,包括免疫檢查點(diǎn)抑制劑等多種免疫療法,在多種腫瘤的治療中均取得了一定療效[2]。目前研究廣泛的免疫檢查點(diǎn)包括細(xì)胞毒 T 淋巴細(xì)胞相關(guān)抗原4(CTLA-4)及程序性細(xì)胞死亡蛋白-1(PD-1)及其配體(PD-L1)。
從TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/https://portal.gdc.cancer.gov/)下載胃癌患者的基因表達(dá)數(shù)據(jù)(包括375例胃癌樣本、32例癌旁組織樣本)和相關(guān)臨床資料(共443例)。再?gòu)拿庖邔W(xué)數(shù)據(jù)庫(kù)ImmPort下載免疫相關(guān)基因(IRGs)的數(shù)據(jù)。
以FDR<0.05,且 logFC≥2或 logFC≤-2作為篩選標(biāo)準(zhǔn),通過(guò)運(yùn)行R軟件中的“edgeR”包,篩選出差異表達(dá)的基因(differential expressed genes,DEGs)。再將DEGs、IRGs取交集,從而得到樣品中存在差異表達(dá)的IRGs。通過(guò)R軟件的“clusterprofiler”“org.Hs.eg.db”包進(jìn)行GO功能富集分析及KEGG通路富集分析。
對(duì)胃癌患者臨床資料進(jìn)行整理,排除了隨訪時(shí)間<30天的胃癌患者數(shù)據(jù),并與差異表達(dá)的IRGs數(shù)據(jù)合并。按照排除標(biāo)準(zhǔn),將胃癌樣本分為T(mén)rain組(224例)、Test組(111例),χ2檢驗(yàn)2組是否具有可比性。利用Train組通過(guò)LASSO回歸算法和Cox分析篩選出與胃癌患者預(yù)后相關(guān)的IRGs,并構(gòu)建IRGs預(yù)后風(fēng)險(xiǎn)模型并用Test組進(jìn)行檢驗(yàn)。然后通過(guò)構(gòu)建的預(yù)后風(fēng)險(xiǎn)模型計(jì)算每例胃癌患者的風(fēng)險(xiǎn)評(píng)分值,將所有胃癌患者分為高、低風(fēng)險(xiǎn)2組,通過(guò)“pheatmap”包、“Kaplan-Meier”生存曲線、“ROC”包、分別繪制Train組和Test組的風(fēng)險(xiǎn)曲線,預(yù)后差異圖形,ROC曲線,評(píng)估模型的預(yù)測(cè)性能。最后再進(jìn)行獨(dú)立預(yù)后分析實(shí)驗(yàn),評(píng)估該模型的風(fēng)險(xiǎn)評(píng)分能否獨(dú)立于年齡、性別、分級(jí)、分期等臨床指標(biāo),作為評(píng)估胃癌患者預(yù)后的獨(dú)立因素。
將胃癌表達(dá)數(shù)據(jù)按照評(píng)估模型分為高、低風(fēng)險(xiǎn)2組,使用CIBERSORT算法進(jìn)行免疫浸潤(rùn),評(píng)估2組中免疫細(xì)胞占比,繪制高、低表達(dá)組免疫細(xì)胞占比的圖形。
通過(guò)“ggpubr”包檢查常見(jiàn)的免疫檢查點(diǎn)在高低風(fēng)險(xiǎn)組表達(dá)是否有差異性。從TCIA數(shù)據(jù)庫(kù)下載胃癌的免疫表達(dá)數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)整理,通過(guò)R語(yǔ)言“ggpubr”包得到免疫治療結(jié)果。
通過(guò)R軟件對(duì)TCGA 數(shù)據(jù)庫(kù)的 375 例胃癌組織及 32 例癌旁組織的基因數(shù)據(jù)進(jìn)行篩選,得到1218個(gè)DFGs,與 ImmPort數(shù)據(jù)庫(kù)的1793個(gè)IRGs數(shù)據(jù)取交集,得到了238個(gè)差異表達(dá)的IRGs,并繪制出差異表達(dá)的IRGs的韋恩圖(圖1A) 和熱圖(圖1B)。通過(guò)R軟件行GO功能富集分析,差異表達(dá)的IRGs主要參與免疫球蛋白生產(chǎn)、免疫反應(yīng)分子介質(zhì)的產(chǎn)生、免疫球蛋白復(fù)合物的形成、抗原結(jié)合等生物學(xué)過(guò)程(圖2A)。KEGG通路富集分析,差異表達(dá)的IRGs主要參與細(xì)胞因子-細(xì)胞因子受體相互作用、神經(jīng)活性配體-受體相互作用等通路(圖2B)。
A:IRGs 與 DEGs 取交集后差異表達(dá)的 IRGs的韋恩圖;B:238 個(gè)差異表達(dá)的 IRGs 的表達(dá)熱圖,黑色表示基因呈高表達(dá),灰色表示基因呈低表達(dá)。
A:差異表達(dá)的IRGs GO功能富集分析;B:差異表達(dá)的 IRGs KEGG通路富集分析。
按照排除標(biāo)準(zhǔn),將胃癌樣本分為T(mén)rain組(224例)、Test組(111例),χ2檢驗(yàn)結(jié)果顯示,Train組、Test組在年齡、性別、分級(jí)、分期、腫瘤的大小及浸潤(rùn)深度、淋巴結(jié)轉(zhuǎn)移情況及遠(yuǎn)處轉(zhuǎn)移情況等方面差異均無(wú)統(tǒng)計(jì)學(xué)意義(均P>0.05),說(shuō)明分組隨機(jī)合理。見(jiàn)表1。整合Train組差異表達(dá)的IRGs數(shù)據(jù)及臨床資料,LASSO回歸得到9個(gè)與胃癌預(yù)后相關(guān)的IRGs,具體為:LBP、MPO、APOH、IGHD3-16、IGHV6-1、CGB5、GHR、RXRG、PRKCG。見(jiàn)圖3。通過(guò)單因素、多因素COX回歸分析構(gòu)建預(yù)后風(fēng)險(xiǎn)模型。單因素COX分析篩選出13個(gè)與胃癌預(yù)后相關(guān)的IRGs。見(jiàn)圖4。多因素COX構(gòu)建預(yù)后風(fēng)險(xiǎn)模型:風(fēng)險(xiǎn)評(píng)分=(MPO表達(dá)量×0.208601965)+(APOH表達(dá)量×0.191139191)+(IGHD3-16表達(dá)量×0.201602081)+(CGB5表達(dá)量×0.185605365)+(GHR表達(dá)量×0.289559538)+(PRKCG×(-0.176078116))。其中MPO、APOH、IGHD3-16 CGB5、GHR為高風(fēng)險(xiǎn)基因。PRKCG為保護(hù)性基因。見(jiàn)表2。
表1 Train組、Test組胃癌患者的臨床病理特征比較(例,%)
表2 胃癌預(yù)后相關(guān)的IRGs(多因素Cox)
圖3 胃癌預(yù)后相關(guān)的IRGs(LASSO回歸)
圖4 胃癌預(yù)后相關(guān)的IRGs(單因素Cox)
按照預(yù)后風(fēng)險(xiǎn)模型計(jì)算每例胃癌患者的風(fēng)險(xiǎn)評(píng)分,根據(jù)中位值分為高、低風(fēng)險(xiǎn)2組,通過(guò)R軟件,繪制出Train組、Test組的風(fēng)險(xiǎn)評(píng)分曲線圖(圖5A)、生存分布散點(diǎn)圖(圖5B)、預(yù)后相關(guān)的 IRGs 的熱圖(圖5C)。Kaplan-Meier 生存分析結(jié)果顯示Train組和Test組中高風(fēng)險(xiǎn)組生存率明顯低于低風(fēng)險(xiǎn)組(P<0.05)。見(jiàn)圖6。繪制模型的ROC 曲線,Train組AUC為0.692,Test組AUC為0.658。見(jiàn)圖7。
黑色為高風(fēng)險(xiǎn)患者,灰色為低風(fēng)險(xiǎn)患者。
圖7 Train組、Test組預(yù)后風(fēng)險(xiǎn)模型的ROC曲線
將各例胃癌患者的風(fēng)險(xiǎn)評(píng)分?jǐn)?shù)據(jù)和各項(xiàng)臨床指標(biāo),包括年齡、性別、分級(jí)、分期等合并,進(jìn)行單因素和多因素Cox分析。單因素Cox分析結(jié)果顯示:年齡、臨床分期、風(fēng)險(xiǎn)評(píng)分與胃癌的預(yù)后有關(guān)(P<0.05);多因素Cox分析結(jié)果顯示,風(fēng)險(xiǎn)評(píng)分、年齡、臨床分期可以作為評(píng)估胃癌患者預(yù)后的獨(dú)立因素(P<0.05)。見(jiàn)圖8。
圖8 影響胃癌預(yù)后的單因素及多因素COX分析
整合患者風(fēng)險(xiǎn)評(píng)分及臨床資料,構(gòu)建列線圖模型。選取一個(gè)樣本,可以獲得其各項(xiàng)指標(biāo)在模型中的對(duì)應(yīng)評(píng)分,并可以計(jì)算總分,預(yù)測(cè)胃癌患者1、3、5年生存率。見(jiàn)圖9。
圖9 預(yù)測(cè)胃癌患者總生存期的列線圖模型
通過(guò)CIBERSORT算法對(duì)所有樣本進(jìn)行免疫細(xì)胞浸潤(rùn)。根據(jù)模型風(fēng)險(xiǎn)評(píng)分的中位值將所有胃癌患者分為高、低風(fēng)險(xiǎn)2組,分析2組間22種免疫細(xì)胞表達(dá)水平的差異,結(jié)果顯示幼稚B細(xì)胞、活化的記憶CD4+T細(xì)胞、靜止肥大細(xì)胞、活化肥大細(xì)胞表達(dá)具有明顯差異(P<0.05)。見(jiàn)圖10。
黑色為高風(fēng)險(xiǎn)患者,灰色為低風(fēng)險(xiǎn)患者。
通過(guò)R軟件“ggpubr”包對(duì)常見(jiàn)的免疫檢查點(diǎn)進(jìn)行篩選,發(fā)現(xiàn)PD-L1在高、低風(fēng)險(xiǎn)組表達(dá)有差異性(P<0.05)。見(jiàn)圖11。從TCIA數(shù)據(jù)庫(kù)下載胃癌的免疫表達(dá)數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)整理,發(fā)現(xiàn)高、低風(fēng)險(xiǎn)組抗PD-1治療效果有差異性(P<0.05)。見(jiàn)圖12。
圖11 PD-L1在高、低風(fēng)險(xiǎn)組的差異表達(dá)
圖12 高、低風(fēng)險(xiǎn)組抗PD-1治療效果
胃癌是一種高度惡性的腫瘤,具有高度的侵襲性及高復(fù)發(fā)率,預(yù)后差。只有早期篩選出預(yù)后不良的因素并進(jìn)行針對(duì)性的個(gè)體化治療,才能夠改善生存率[3],因此需要更為敏感可靠的生物標(biāo)志物。大多數(shù)利用公共數(shù)據(jù)庫(kù)如TCGA、GEO構(gòu)建胃癌預(yù)后模型利用了全部樣本構(gòu)建模型,缺乏模型驗(yàn)證[4]。本研究將TCGA胃癌樣本分為T(mén)rain組、Test組,2組在年齡、性別、分級(jí)、分期、腫瘤的大小及浸潤(rùn)深度、淋巴結(jié)轉(zhuǎn)移情況及遠(yuǎn)處轉(zhuǎn)移情況等方面差異均無(wú)統(tǒng)計(jì)學(xué)意義。在Train組中建模,在Test組中檢驗(yàn)。本研究構(gòu)建的模型在Train組、Test組中均能有效評(píng)估胃癌患者預(yù)后,且該模型可以作為胃癌預(yù)后的獨(dú)立危險(xiǎn)因素。該預(yù)后風(fēng)險(xiǎn)模型由MPO、APOH、IGHD3-16、CGB5、GHR、PRKCG6個(gè)基因構(gòu)成,其中MPO、APOH、IGHD3-16、CGB5、GHR高表達(dá)可能促進(jìn)胃癌發(fā)生發(fā)展,PRKCG高表達(dá)可能會(huì)改善腫瘤的預(yù)后,其中4個(gè)風(fēng)險(xiǎn)基因被報(bào)道與胃癌或其他惡性腫瘤發(fā)生、發(fā)展及預(yù)后相關(guān)。髓過(guò)氧化物酶(MPO)是一種溶酶體酶,存在于嗜中性粒細(xì)胞,單核細(xì)胞和組織巨噬細(xì)胞中,MPO SNP rs2333227 C-T突變改變了轉(zhuǎn)錄因子AP-2α與rs2333227突變區(qū)的結(jié)合親和力,依次提高了MPO的表達(dá)水平,進(jìn)一步激活了IL23A-MMP9軸介導(dǎo)的致癌信號(hào)傳導(dǎo)[5]。有研究指出APOH在肝細(xì)胞癌中表達(dá)上調(diào)[6],機(jī)制尚不清楚。生長(zhǎng)激素受體(GHR)是生長(zhǎng)激素(GH)的同源受體,屬于I類細(xì)胞因子受體超家族的膜結(jié)合受體,可以通過(guò)介導(dǎo)PI3K/AKT信號(hào)通路控制G1細(xì)胞周期進(jìn)展來(lái)調(diào)節(jié)胃癌細(xì)胞的生長(zhǎng)和凋亡[7]。蛋白激酶Cγ(PRKCG)作為蛋白激酶Cs(PKCs)的同工酶,介導(dǎo)IL-2表達(dá)和腫瘤免疫應(yīng)答[8]。第20絲氨酸位點(diǎn)也可以在p53中磷酸化以激活結(jié)腸癌細(xì)胞的凋亡[9]。CD4+T細(xì)胞浸潤(rùn)是影響結(jié)腸癌預(yù)后的獨(dú)立危險(xiǎn)因素[10],該模型下高風(fēng)險(xiǎn)組活化的記憶CD4+T細(xì)胞浸潤(rùn)比例減少,部分解釋了該組患者預(yù)后差的原因。程序性細(xì)胞死亡1(PD-1)信號(hào)傳導(dǎo)通常被癌細(xì)胞劫持以逃避免疫監(jiān)視[11]。當(dāng)PD-1和T細(xì)胞受體(TCR)與其配體結(jié)合時(shí),PD-1的免疫受體酪氨酸抑制基序和免疫受體酪氨酸基開(kāi)關(guān)基序被磷酸化[12]。隨后,Src同源區(qū)2含有磷酸酶(SHP-2)被招募和激活,逆轉(zhuǎn)TCR和CD28下游信號(hào)傳導(dǎo)的磷酸化[13]。目前,阻斷PD-1或其配體PD-L1的抗體已被批準(zhǔn)用于治療各種實(shí)體惡性腫瘤和血液系統(tǒng)惡性腫瘤[14-16]。
綜上所述,本研究利用TCGA胃癌數(shù)據(jù),分組構(gòu)建了由6個(gè)免疫相關(guān)基因組成的預(yù)后風(fēng)險(xiǎn)模型,通過(guò)評(píng)估該模型的預(yù)測(cè)性能,發(fā)現(xiàn)該模型具有潛在臨床應(yīng)用價(jià)值。