葉必成,繆夏曄,劉樹(shù)青
1徐州醫(yī)科大附屬淮安醫(yī)院消化內(nèi)科,江蘇淮安223001;2揚(yáng)州大學(xué)醫(yī)學(xué)院
肝癌全球發(fā)病率在惡性腫瘤中居第六位,是腫瘤相關(guān)死亡的第四大原因[1]。肝細(xì)胞癌(HCC)是最常見(jiàn)的原發(fā)性肝癌,早期HCC患者的主要治療手段為外科手術(shù)切除,然而大部分患者在診斷時(shí)已為晚期,其對(duì)應(yīng)的治療手段非常局限,因此預(yù)后極差。對(duì)于HCC患者預(yù)后的預(yù)測(cè)及治療方案的確定,臨床通常用AJCC分期、肝功能指標(biāo)及AFP進(jìn)行評(píng)估[2-3],然而相同分期的HCC患者預(yù)后也可能不同,且分子遺傳學(xué)也證明不同亞群的HCC患者預(yù)后有差異[4]。因此,有必要探尋一種新型的生物學(xué)標(biāo)志物以有效評(píng)估HCC患者預(yù)后。CTL作為T(mén)細(xì)胞的重要組成部分,其表面受體主要為CD8,是抵抗腫瘤進(jìn)展的主要免疫細(xì)胞[5]。先前一項(xiàng)研究通過(guò)規(guī)律間隔成簇短回文重復(fù)序列在小鼠癌細(xì)胞株(腎癌、乳腺癌、黑色素細(xì)胞瘤、結(jié)直腸癌)中確定了182個(gè)與CTL相關(guān)的基因(CRG),CRG增強(qiáng)或減弱了CTL對(duì)癌細(xì)胞的殺傷[6]。然而,CRG在HCC中的作用尚未被系統(tǒng)研究。本研究旨在觀察CRG在HCC的表達(dá)情況以及探索其與預(yù)后的關(guān)系,并基于這些基因構(gòu)建預(yù)后預(yù)測(cè)模型,以期有助于評(píng)估患者預(yù)后及臨床精準(zhǔn)化治療。
1.1 資料來(lái)源 從TCGA(https://portal.gdc.cancer.gov/repository)下載371例HCC患者共424個(gè)樣本(包含50個(gè)癌旁樣本)的資料,其中3例HCC組織重復(fù)測(cè)序2次。下載時(shí)間:2017年6月—2021年1月。排除生存時(shí)間為0患者6例,共納入HCC患者365例?;颊吣?46例、女119例;年齡16~90歲,中位年齡61歲;腫瘤分級(jí)G1級(jí)55例、G2級(jí)175例、G3級(jí)118例、G4級(jí)12例、未知5例;腫瘤分期Ⅰ期170例、Ⅱ期84例、Ⅲ期83例、Ⅳ期4例、未知24例;存在血管浸潤(rùn)106例、無(wú)血管浸潤(rùn)205例、未知54例;AFP≤200 ng/mL 201例、AFP>200 ng/mL 75例、AFP未知89例。
從ICGC(https://dcc.icgc.org/projects/LIRI-JP)下載231例HCC患者的RNA-seq數(shù)據(jù)和臨床資料,用作模型驗(yàn)證。下載時(shí)間:2019年3月—2021年1月。該隊(duì)列患者未存在重復(fù)測(cè)序以及生存資料缺失,既往有乙型肝炎或丙型肝炎病史?;颊吣?70例、女61例;年齡31~89歲,中位年齡69歲;腫瘤分期Ⅰ期36例、Ⅱ期105例、Ⅲ期71例、Ⅳ期19例。對(duì)于重復(fù)測(cè)序的HCC組織,取其基因表達(dá)譜數(shù)據(jù)的平均值。若有多個(gè)探針對(duì)應(yīng)同一個(gè)基因,則該基因的表達(dá)量為這些探針的均值。以上數(shù)據(jù)均為公開(kāi)數(shù)據(jù)。
1.2 差異表達(dá)CRG的篩選 應(yīng)用“base”R軟件包中的“wilcox.test”函數(shù)對(duì)371例HCC組織和50例癌旁組織的CRG進(jìn)行表達(dá)差異分析,篩選標(biāo)準(zhǔn):錯(cuò)誤發(fā) 現(xiàn) 率(FDR)<0.05且|log2Fold Change|≥1,F(xiàn)oldChange為差異倍數(shù)。
1.3 與總生存期(OS)相關(guān)CRG的篩選 將具有生存信息的365例HCC患者與各個(gè)CRG的表達(dá)數(shù)據(jù)進(jìn)行合并,并用“base”R軟件包中的“coxph”函數(shù)對(duì)CRG進(jìn)行基于OS以及生存狀態(tài)的單因素回歸分析,計(jì)算各個(gè)CRG的P值以及風(fēng)險(xiǎn)比(HR),P<0.05為與OS相關(guān)CRG。
1.4 預(yù)后預(yù)測(cè)模型的構(gòu)建與驗(yàn)證 利用R軟件“base”包中的“intersect”函數(shù)確定既為差異表達(dá)又與OS相關(guān)的CRG,并使用“glmnet”R軟件包中的“glmnet”函數(shù)和“cv.glmnet”函數(shù)對(duì)這些基因進(jìn)行基于OS以及生存狀態(tài)的Lasso-Cox回歸分析,其中maxit=1 000。計(jì)算經(jīng)Lasso-Cox回歸所確定的各個(gè)基因的系數(shù),并乘以這些基因?qū)?yīng)的表達(dá)水平,所得結(jié)果之和為風(fēng)險(xiǎn)評(píng)分。以風(fēng)險(xiǎn)評(píng)分的中位數(shù)為截?cái)嘀?,將TCGA隊(duì)列以及ICGC隊(duì)列的患者分為高危組和低危組。利用“survival”包的“survdiff”對(duì)高、低危組患者進(jìn)行基于Kaplan-Meier法的生存分析,并進(jìn)行Log-rank檢驗(yàn)評(píng)估兩組的預(yù)后差異。利用“Rtsne”的“prcomp”和“Rtsne”函數(shù)對(duì)Lasso-Cox回歸所確定的基因進(jìn)行PCA及t-SNE分析,以探索高、低危組患者分布情況。利用“timeROC”R軟件包的“timeROC”函數(shù)進(jìn)行時(shí)間相關(guān)的ROC曲線分析,計(jì)算曲線下面積(AUC)。
1.5 基因本體(GO)富集分析、京都基因與基因組百科全書(shū)(KEGG)富集分析及單樣本基因集富集分析(ssGSEA) 利用“clusterProfiler”R軟件包的“enrichGO”函數(shù)以及“enrichKEGG”函數(shù)對(duì)TCGA隊(duì)列的高、低危組之間的差異表達(dá)基因進(jìn)行GO以及KEGG富集分析,其中GO富集分析包括生物學(xué)過(guò)程(BP)、細(xì)胞組成(CC)以及分子功能(MF)。利用“gsva”R軟件包的“gsva”函數(shù)對(duì)TCGA隊(duì)列的高、低危組進(jìn)行ssGSEA,以量化免疫細(xì)胞浸潤(rùn)及免疫相關(guān)功能激活情況。
1.6 統(tǒng)計(jì)學(xué)方法 采用R4.0.2軟件。差異表達(dá)基因(DEG)的鑒定采用Wilcoxon檢驗(yàn),并用BH法對(duì)P值進(jìn)行矯正,篩選標(biāo)準(zhǔn)為FDR<0.05且|log2 Fold Change|≥1。如上文無(wú)特殊規(guī)定,則P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 與OS相關(guān)的差異表達(dá)CRG 共篩選出37個(gè)與OS相關(guān)的差異表達(dá)DRG。見(jiàn)圖1。
圖1 與OS相關(guān)差異表達(dá)CRG的篩選
2.2 基于TCGA隊(duì)列建立預(yù)后模型 Lasso-Cox回歸將上述37個(gè)DRG進(jìn)行再次篩選,并使用交叉驗(yàn)證建立模型,最終建立了基于6個(gè)CRG(ATG10、HDAC1、PIGU、AHSA1、CAD、CEP55)的預(yù)后預(yù)測(cè)模型,其風(fēng)險(xiǎn)評(píng)分的計(jì)算公式為0.384×ATG10表達(dá)值+0.076×HDAC1表 達(dá)值+0.270×PIGU 表 達(dá) 值+0.153×AHSA1表達(dá)值+0.208×CAD表達(dá)值+0.169×CEP55表達(dá)值。
2.3 預(yù)后預(yù)測(cè)模型的外部驗(yàn)證結(jié)果 上述公式計(jì)算ICGC隊(duì)列的風(fēng)險(xiǎn)評(píng)分,并以風(fēng)險(xiǎn)評(píng)分的中位數(shù)作為截?cái)嘀祵CGC隊(duì)列的患者分為高危組和低危組??紤]到OS超過(guò)5年的患者僅2例,因此僅評(píng)估該模型對(duì)患者術(shù)后1~4年生存率的預(yù)測(cè)價(jià)值。ROC曲線顯示,該模型對(duì)患者術(shù)后1~4年預(yù)后預(yù)測(cè)的曲線下面積分別為0.70、0.70、0.74、0.74。
2.4 GO富集分析、KEGG富集分析及ssGSEA結(jié)果
2.4.1 GO富集分析結(jié)果 差異表達(dá)的DRG在淋巴細(xì)胞介導(dǎo)免疫、補(bǔ)體激活、細(xì)胞吞噬、離子通道活性相關(guān)分子功能等生物學(xué)過(guò)程富集。見(jiàn)表1。
表1 GO富集分析結(jié)果(BP、CC及MF的前5位)
2.4.2 KEGG富集分析結(jié)果 差異表達(dá)的DRG基因在細(xì)胞因子-細(xì)胞因子受體的相互作用、細(xì)胞周期及部分癌癥通路顯著富集。見(jiàn)表2。
表2 KEGG富集分析(前10位)
2.4.3 ssGSEA結(jié)果 高危組活化的樹(shù)突細(xì)胞(aDC)、未成熟的樹(shù)突細(xì)胞(iDC)、漿細(xì)胞樣樹(shù)突細(xì)胞(pDC)、抗原提呈細(xì)胞共刺激(APC co-stimulation)、主要組織相容性復(fù)合體Ⅰ型分子(MHC class I)富集評(píng)分(0.62、0.61、0.72、0.98分)高于低危組(中位數(shù)分別為0.60、0.60、0.68、0.97分),比較差異有統(tǒng)計(jì)學(xué)意義(P均<0.05);高危組Ⅰ型干擾素反應(yīng)(Type I IFN Reponse)、Ⅱ型干擾素反應(yīng)(TypeⅡIFN Reponse)、NK細(xì)胞富集評(píng)分(0.82、0.77、0.60分)較低危組(0.83、0.80、0.62分)低,高危組調(diào)節(jié)性T細(xì)胞(Treg)富集評(píng)分(0.81分)較低危組(0.80分)高(P<0.05),比較差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。
越來(lái)越多的證據(jù)表明,腫瘤微環(huán)境是影響腫瘤發(fā)生發(fā)展的重要因素[7]。腫瘤微環(huán)境主要由癌細(xì)胞、基質(zhì)細(xì)胞、免疫細(xì)胞、趨化因子和細(xì)胞因子共同構(gòu)成[8],其中CTL是抵抗腫瘤進(jìn)展的主要免疫效應(yīng)細(xì)胞。然而,由于癌細(xì)胞不具有很強(qiáng)的免疫原性,因此CTL在腫瘤微環(huán)境中是被抑制的[9]。目前已開(kāi)發(fā)了諸如免疫檢查點(diǎn)抑制劑(PD-1、PDL-1和CTLA4)等免疫療法用于促進(jìn)CTL特異性免疫應(yīng)答,然而對(duì)于HCC患者,PD-1及PDL-1的有效應(yīng)答率卻不到20%[10]。因此識(shí)別HCC中影響CTL功能的關(guān)鍵基因至關(guān)重要。本研究綜合分析182個(gè)CRG,最終篩選了6個(gè)與OS顯著相關(guān)的關(guān)鍵CRG,并基于CRG構(gòu)建了HCC預(yù)后預(yù)測(cè)模型。該模型對(duì)患者術(shù)后1~4年預(yù)后預(yù)測(cè)的曲線下面積均≥0.70。提示該模型具有良好的預(yù)測(cè)效能。
本研究發(fā)現(xiàn),近30%的CRG在腫瘤組織與癌旁組織之間差異表達(dá),單因素Cox回歸分析表明超過(guò)50%的CRG與OS相關(guān),這進(jìn)一步證明了CTL在HCC發(fā)生發(fā)展中起重要作用。最終篩選出6個(gè)與預(yù)后相關(guān)的關(guān)鍵CRG,即ATG10、HDAC1、PIGU、AHSA1、CAD、CEP55。除AHSA1和CAD以外,均存在相關(guān)研究報(bào)道,這些基因在HCC中高表達(dá),并且與OS相關(guān),與本研究的發(fā)現(xiàn)一致。ATG10,位于5q14.1,是細(xì)胞自噬啟動(dòng)的必要條件[11]。JO等[12]報(bào)道ATG10表達(dá)增加與血管侵襲和淋巴結(jié)轉(zhuǎn)移相關(guān)。HDAC1是組蛋白去乙?;讣易宄蓡T之一,直接參與調(diào)控細(xì)胞自噬[13]。HDAC1的高表達(dá)促進(jìn)了HCC細(xì)胞增殖并抑制HCC細(xì)胞凋亡[14]。PIGU是GPI-T復(fù)合物的一個(gè)重要亞基[15],GPI-T復(fù)合物在腫瘤的發(fā)生發(fā)展中起至關(guān)重要的作用。WEI等[16]的研究發(fā)現(xiàn),PIGU高表達(dá)不但促進(jìn)了HCC細(xì)胞的增殖,遷移和侵襲,而且抑制了細(xì)胞凋亡。此外,他們還發(fā)現(xiàn),PIGU的下調(diào)顯著增強(qiáng)了NK-92細(xì)胞對(duì)HCC細(xì)胞的敏感性。AHSA1為HSP90的一個(gè)關(guān)鍵分子伴侶,參與致癌蛋白的成熟、穩(wěn)定、激活[17],其與HSP90構(gòu)成的復(fù)合體也被證實(shí)是細(xì)胞自噬通路的關(guān)鍵蛋白[18]。本研究首次發(fā)現(xiàn),AHSA1在HCC中高表達(dá),并且與OS顯著相關(guān),其在HCC的具體生物學(xué)作用尚未明確,我們將進(jìn)一步研究證實(shí)。CAD是一個(gè)具有三個(gè)酶結(jié)構(gòu)域的多肽,包括氨基甲?;姿岷铣擅浮⑻於彼徂D(zhuǎn)氨甲酰酶及二氫乳清酸酶,為嘧啶從頭合成的關(guān)鍵酶[19]。CAD與腫瘤相關(guān)的報(bào)道較少,本研究首次發(fā)現(xiàn),CAD在HCC中高表達(dá),并且與OS相關(guān)。CEP55,又名C10orf3,為中心體蛋白相關(guān)蛋白家族成員,其主要生物學(xué)功能為中心體復(fù)制、細(xì)胞周期及胞質(zhì)分裂[20]。自噬蛋白 NBR1通過(guò)識(shí)別 CEP55,進(jìn)而招募自噬相關(guān)蛋白形成自噬體。LI等[21]發(fā)現(xiàn),CEP55通過(guò)調(diào)節(jié)JAK2-STAT3-MMPs信號(hào)通路來(lái)促進(jìn)HCC細(xì)胞遷移和侵襲。除PIGU和CAD以外,以上基因均有報(bào)道證明直接或間接參與細(xì)胞自噬,細(xì)胞自噬有助于癌細(xì)胞逃避CTL的攻擊[6]。本研究進(jìn)一步證實(shí),在HCC中細(xì)胞自噬通路介導(dǎo)CTL相關(guān)免疫逃避的關(guān)鍵性,也揭示了細(xì)胞自噬在HCC在發(fā)生發(fā)展中起重要作用。然而,對(duì)以上CRG在HCC中作用的了解仍然有限,其影響HCC預(yù)后的分子機(jī)制以及對(duì)HCC患者臨床治療的意義有待進(jìn)一步研究。
為進(jìn)一步探索高危組患者預(yù)后差的潛在機(jī)制,本研究基于TCGA隊(duì)列的高、低危組進(jìn)行了GO富集分析、KEGG富集分析及ssGSEA。本研究發(fā)現(xiàn),免疫相關(guān)通路、離子通道以及一些癌癥通路顯著富集。研究證明離子通道在T細(xì)胞的穩(wěn)定與活化發(fā)揮重要作用[22],這與本研究的發(fā)現(xiàn)一致。低危組和高危組的抗原提呈相關(guān)細(xì)胞及功能的富集得分存在顯著差異,表明腫瘤相關(guān)抗原在高危組更容易識(shí)別,但高危組患者預(yù)后更差,可能是與高危組的CTL功能下降有關(guān)。高危組的Tregs富集得分相對(duì)于低危組更高。Tregs顯著抑制CTL的功能,進(jìn)一步證明了高危組的CTL功能被抑制。高危組的Ⅰ型干擾素反應(yīng)、Ⅱ型干擾素反應(yīng)及NK細(xì)胞富集得分較低危組低。因此,高危組患者抗腫瘤免疫力的減弱是其預(yù)后不良的主要因素。
綜上所述,本研究構(gòu)建的模型可有效預(yù)測(cè)HCC患者預(yù)后,有助于HCC患者預(yù)后預(yù)測(cè)體系的完善及臨床個(gè)體化治療方案的開(kāi)發(fā)。