周銳 余運霖 焦鑫 余梟 高文哲 張先林
1三峽大學附屬仁和醫(yī)院普外科,宜昌 443001;2中南大學湘雅三醫(yī)院肝膽胰外科,長沙 410000
【提要】 通過TCGA數據庫中CCL2基因表達譜,對其差異表達基因(DEGs)做相關性分析,然后與臨床生存信息結合,經過建模驗證后獲得預后相關DEGs,進而探討DEGs部分基因的作用及對胰腺癌患者生存的影響。結果表明,CCL2相關性基因 在胰腺癌中扮演重要角色,其低表達與胰腺癌患者的預后成正相關。
趨化因子是一類由細胞分泌的小細胞因子或信號蛋白,具有誘導附近反應細胞定向趨化的能力[1],是主導細胞遷徙的關鍵調節(jié)劑,對惡性腫瘤的發(fā)展有極大影響。CCL2是趨化因子CC亞家族中的重要成員,為促進單核細胞及巨噬細胞遷徙的關鍵因子之一,已經證實,CCL2在多種腫瘤發(fā)展進程中發(fā)揮作用[2-5],通過抑制細胞凋亡、壞死和自噬等過程提高癌細胞的存活能力[6-8],并在腫瘤微環(huán)境中與其受體相互作用,調節(jié)單核細胞的趨化性從而導致腫瘤的發(fā)展。然而,CCL2在胰腺癌中的作用機制尚不明確。本研究通過生物信息學分析CCL2及其相關差異表達基因,探討它們在胰腺癌組織中的表達及其與患者預后的相關性。
1.數據集的選擇:從腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA,)數據庫下載178例胰腺癌患者的基因表達譜,從TCGA數據庫的連接網站UCSC XENA下載178例胰腺癌患者對應的完整臨床數據。
2.基因表達差異分析及相關性分析:根據CCL2基因表達量中位數,將178例患者分為高、低表達兩組,以logFC=1且P<0.05為標準,采用R/Bioconductor軟件的limma包對比篩選差異表達基因(differentially expressed genes,DEGs)。采用R軟件的corplot包對TCGA樣本與CCL2基因進行相關性分析,得到各個基因的相關系數,以相關系數的絕對值0.15為界限,選取相關基因與DEGs的交集,得到相關DEGs。根據178例患者的中位生存時間和生存狀態(tài),采用R軟件的ezcox包進行批量COX回歸分析,以P<0.05為差異有統計學意義,篩選與預后相關的DEGs。
3.預后相關DEGs功能富集分析:使用R/Bioconductor軟件的clusterprofiler包對預后相關DEGs進行功能富集分析,包括基因本體(gene ontology,GO)分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Gene and Genomes,KEGG)通路富集分析,其中GO包括細胞成分、分子功能和生物學過程3個部分。
4.風險預測模型的建立與評估:采用R軟件的glmnet包,用Lasso方法篩選變量,建立Cox回歸模型,并計算基因的相關回歸系數,獲得預后相關DEGs模型。然后二次建模,根據回歸系數加權建立胰腺癌預后風險評估公式,繪制生存曲線和受試者工作特征曲線(receiver operating characteristic, ROC),計算曲線下面積(area under the curve, AUC),并將預測模型可視化為列線圖。
5.統計學處理:采用R軟件(3.6.0版本)進行統計學分析。應用Wilcoxon秩和檢驗分析CCL2關鍵相關基因在胰腺癌組織中的差異表達,計量資料采用t檢驗,計數資料采用χ2檢驗。基因間的相關性采用Spearman相關分析,0.1≤|r|≤1.0時定義為存在相關;生存曲線采用Kaplan-Meier法和Log-rank檢驗。P<0.05為差異有統計學意義。
1.CCL2相關差異表達基因及功能和通路富集分析:通過差異分析及相關性分析,得到上調基因60個,下調基因304個,相關DEGs 223個(圖1A)。結合患者中位生存時間和生存狀態(tài),進行多基因的COX回歸分析,得到與患者預后相關的DEGs 20個。GO功能富集分析和KEGG通路富集分析發(fā)現,20個DEGs主要富集對IL-1、TNF的應答和G蛋白偶聯受體結合位點上以及干細胞黏附分子、趨化因子信號通路上(圖1B、1C)。
圖1 胰腺癌CCL2相關差異表達基因的火山圖(1A)及胰腺癌CCL2相關差異表達基因功能富集圖(1B)和通路富集圖(1C)
2.預后相關DEGs風險模型及驗證:Lasso Cox回歸分析篩選得到12個基因,分別為VTCN1、RXRG、HSD11B1、RELN、LCN6、MUC15、C1S、CLDN10、TRARG1、CCL18、SLC7A10、ZNF831,其中VTCN1、HSD11B1、C1S為高風險基因;Kaplan-Meier單變量分析結果顯示,高風險基因與患者生存期短有關。根據回歸系數得到患者的風險評分,并將患者分為高、低風險組,Kaplan-Meier法進行生存分析結果顯示,兩組患者生存期差異有統計學意義(P<0.05),高風險組患者生存期明顯縮短(圖2A)。預測模型的ROC曲線見圖2A,AUC值為0.716,表明該模型可預測胰腺癌患者的預后(圖2B)。將預測模型可視化為生存預測列線圖(圖2C)。
圖2 胰腺癌高、低風險組患者的生存曲線(2A)及生存預測的ROC曲線(2B)和列線圖(2C)
討論胰腺癌惡性程度高,預后差,了解其腫瘤免疫微環(huán)境,對疾病的干預和預后的判斷具有重要意義。有證據表明,高CCL2水平與更具侵襲性的惡性腫瘤、更高的轉移概率和更廣泛的癌癥預后相關[9]。CCL2在聚集腫瘤相關巨噬細胞中發(fā)揮作用,促使胰腺癌細胞重新改變其代謝途徑耐以生存,并使得胰腺癌細胞能夠在缺氧的條件下增殖[10-12]。本研究通過GO功能和KEGG通路富集分析發(fā)現,CCL2相關因子除了作用于常規(guī)趨化因子通路外,還聚集干細胞黏附、IL-1的免疫反應和G蛋白受體的結合,可能與腫瘤的浸潤、遠處轉移、逃離細胞免疫監(jiān)視等方面有關。根據CCL2相關性因子及Lasso Cox回歸分析篩選的12個建?;蛑?,ZNF831被報道富集于CD4+T細胞浸潤[13],進而可能參與調控胰腺癌CD4+T細胞的基因表達;SLC7A10屬于溶質載體家族,其過表達降低了ROS生成并增加了線粒體呼吸的能力,促使脂肪細胞肥大,促進肥胖和胰島素抵抗,進而引起血糖的變化,使得胰腺癌的風險增加[14];而同樣,作為趨化因子家族的CCL18也能促使腫瘤的轉移[15];RXRG高表達會引起血脂的異常風險增加,而血脂和血糖的變化與胰腺癌有著密切關系[16]。CCL2由于能夠激活絲裂原活化蛋白激酶(MAPK)信號通路,阻礙T細胞增殖,伴隨著持續(xù)的免疫抑制,通過促進髓源性抑制細胞(M-MDSCs)的免疫抑制能力,從而促使腫瘤生長和增殖[17]。血漿CCL2水平的升高是大腸癌復發(fā)的預測生物標志物[18]。趨化因子CCL2的表觀遺傳沉默抑制巨噬細胞浸潤以促進腫瘤的發(fā)展[19]。本研究結果顯示,相比低風險組患者,高風險患者生存期明顯縮短(P<0.05);ROC曲線示該模型可以預測胰腺癌患者的預后。該模型基于各類基因的總體表達量,更符合當今的系統治療理念。
同時,本研究也存在一些缺陷。首先,本研究是通過生物信息學構建的預后預測模型,無外部的實驗數據驗證,臨床實際應用價值有限。其次,由于TCGA的樣本數量局限性,不能完整地闡述CCL2作用機制引起相關基因的差異性表達。最后,需要更多的病例數量獨立隊列研究來驗證。
利益沖突所有作者聲明無利益沖突