王錦航,彭士雄,楊凱成,陳彥平,崔子峰
口腔鱗狀細胞癌(oral squamous cell carcinoma,OSCC)是頭頸部最常見的惡性腫瘤。盡管臨床診斷和治療不斷改進,但過去10年間OSCC患者的病死率并未顯著改善[1-2]。目前臨床中用于風險分層或預后監(jiān)測的傳統(tǒng)指標在評估OSCC患者的預后中仍存在許多不足,因此有必要挖掘潛在的生物標志物來更準確地實現(xiàn)對OSCC患者預后的評估,從而幫助臨床醫(yī)生為不同風險的OSCC患者選擇個性化的治療策略。
免疫細胞廣泛分布于腫瘤免疫微環(huán)境(tumor immune microenvironment,TIME)中,并與腫瘤的發(fā)生和進展密切相關(guān)[3]。免疫逃逸可通過表達免疫監(jiān)視位點配體或分泌免疫抑制因子來抑制免疫系統(tǒng)對腫瘤的有效識別和殺傷,被認為是腫瘤的特征之一[4-5]。既往學者的研究已證實了單個或多個免疫相關(guān)基因(immune-related genes,IRGs)在OSCC中的表達失調(diào),但缺乏結(jié)合數(shù)據(jù)庫分析IRGs與TIME或OSCC患者預后間關(guān)系的研究。因此,本研究利用癌癥基因組圖譜(the cancer genome atlas,TCGA)-OSCC數(shù)據(jù)庫和免疫基因數(shù)據(jù)庫等,構(gòu)建了一個由15個預后相關(guān)且差異表達的免疫相關(guān)基因(differentially expressed immune-related genes,DEIRGs)組成的OSCC風險預測模型,并探討了該模型在OSCC患者預后和臨床中的價值。此外,本研究還分析了DEIRGs的轉(zhuǎn)錄調(diào)控機制以及模型對臨床病理和TIME的影響,報道如下。
1.1 數(shù)據(jù)的獲取和處理 本研究使用R軟件(v3.5.2)進行統(tǒng)計分析和繪圖。從TCGA數(shù)據(jù)庫下載截至2021年7月HTSeq-FPKM類型的OSCC RNA-seq數(shù)據(jù),包括330個OSCC和32個正常樣本。數(shù)據(jù)中的基因名稱通過Ensembl數(shù)據(jù)庫提供的文件“homo_sapiens.grch38.104.chr.gtf.gz”進行注釋和轉(zhuǎn)換。最后通過R“l(fā)imma”包對數(shù)據(jù)進行預處理。OSCC患者的預后和臨床病理數(shù)據(jù)同樣從TCGA數(shù)據(jù)庫下載,其中包括性別、年齡、總生存期(overall survival,OS)、生存狀態(tài)、腫瘤分化程度、腫瘤分期和T分期。由于數(shù)據(jù)中大多數(shù)OSCC患者的M和N分期數(shù)據(jù)缺失,因此本研究未包括這些數(shù)據(jù)的分析。IRGs目錄從ImmPort數(shù)據(jù)庫下載,包含2 483個已通過研究驗證的IRGs。與癌癥相關(guān)的318個轉(zhuǎn)錄因子(transcription factors,TFs)目錄從Cistrome癌癥項目下載。
1.2 DEIRGs的鑒定和富集分析 對預處理后的數(shù)據(jù)進行Wilcoxon秩和檢驗,以FDR<0.05和|logFC|>1作為閾值來鑒定OSCC和正常樣本間的差異表達基因。將差異表達基因與IRGs間的重疊基因選定為DEIRGs。通過R包(clusterProfiler、org.hs.eg.db、enrichplot、ggplot2)、Gene Ontology(GO)和Kyoto Encyclopedia of Genes and Genomes(KEGG)數(shù)據(jù)庫對DEIRGs行富集分析,以明確DEIRGs可能參與的生物學機制,P<0.05為差異具有統(tǒng)計學意義。
1.4 預后相關(guān)DEIRGs和差異表達轉(zhuǎn)錄因子(diffe-rentially expressed TFs,DETFs)間調(diào)控網(wǎng)絡的構(gòu)建 選擇在TFs和差異表達基因間重疊的基因作為DETFs。以P<0.05和|COR|>0.3作為閾值,利用Pearson檢驗分析預后相關(guān)DEIRGs和DETFs間的關(guān)系。Cytoscape軟件(v3.8.2)可視化兩者間的調(diào)控網(wǎng)絡。
1.5 風險預測模型的能力和相關(guān)性分析 依據(jù)模型公式計算每個OSCC患者的RiskScore,并以中位數(shù)作為截斷值將其分為低風險組和高風險組。使用R“survivor”包對低、高風險組行Kaplan-Meier生存曲線分析。使用R“survivalROC”包繪制時間相關(guān)的受試者工作特征(ROC)曲線,并計算曲線下面積(AUC)來評估模型預測預后的準確性。AUC值的范圍:0.5~0.7表示中等準確性,>0.7~0.9表示較高準確性,>0.9表示高準確性[7]。使用R“survivalROC”包評估模型相較于傳統(tǒng)臨床病理特征的預測準確性優(yōu)勢。使用R“survivor”包對模型和OSCC患者的臨床病理特征進行單因素和多因素Cox分析,以驗證模型的獨立預后價值。使用R“beeswarm”包對模型和OSCC患者的臨床病理特征進行相關(guān)性分析。利用TIMER數(shù)據(jù)庫和Pearson檢驗分析模型分別與B細胞、CD4+T細胞、CD8+T細胞、巨噬細胞、中性粒細胞和樹突狀細胞間浸潤的關(guān)系。P<0.05為差異具有統(tǒng)計學意義。
2.1 差異表達基因、DEIRGs和DETFs的鑒定 在OSCC和正常樣本的39 740個mRNA中共鑒定出3 634個差異表達基因(FDR<0.05和|logFC|>1),其中上調(diào)基因2 404個,下調(diào)基因1 230個(圖1A)。差異表達基因和IRGs的交集鑒定出330個DEIRGs,其中上調(diào)基因215個,下調(diào)基因115個(圖1B)。差異表達基因與TFs的交集鑒定出61個DETFs,其中上調(diào)基因42個,下調(diào)基因19個(圖1C)。
注:A. 差異表達基因的鑒定;B. DEIRGs的鑒定;C. DETFs的鑒定。紅色為上調(diào)基因, 綠色為下調(diào)基因, 黑色為無差異基因。圖1 差異表達基因、DEIRGs和DETFs的鑒定Fig.1 Identification of differentially expressed genes, DEIRGs, and DETFs
2.2 DEIRGs的富集分析 GO富集分析顯示,DEIRGs主要涉及“GO:0048018 受體配體活性” “GO:0005126 細胞因子受體結(jié)合”和“GO:0005125 細胞因子活性”等(P<0.05)。KEGG富集分析顯示,DEIRGs主要參與“hsa04060 細胞因子—細胞因子受體相互作用”“hsa04151 PI3K-Akt信號通路”和“hsa04630 JAK-STAT信號通路”等(P<0.05),見表1。
表1 DEIRGs的富集分析Tab.1 Enrichment analysis of DEIRGs
2.3 預后相關(guān)DEIRGs和DETFs間的調(diào)控網(wǎng)絡 通過對DEIRGs和OSCC患者的OS行單因素Cox回歸分析篩選出20個與預后相關(guān)的DEIRGs(P<0.05)(圖2A),分別為VEGFD、SFTPA2、SEMA3A、GAST、BIRC5、STC1、DKK1、CCL26、IL1A、PLAU、CXCL8、SLURP1、PDGFRB、PGLYRP4、IL36A、TNFRSF19、CTLA4、SEMA3G、IL17RD、AVPR2。Pearson檢驗發(fā)現(xiàn)16個預后相關(guān)的DEIRGs 和28個DETFs間存在相關(guān)性(P<0.05,|COR|>0.3),其中僅SLURP1與BRCA1或CDK2之間以及BIRC5與KAT2B之間呈負相關(guān),其余均為正相關(guān)。并且BIRC5、SEMA3G、IL17RD和CTLA4在該調(diào)控網(wǎng)絡中可能扮演核心角色(圖2B)。
注:A. 預后相關(guān)DEIRGs的森林圖。紅色為高風險;綠色為低風險。B. 預后相關(guān)DEIRGs和DETFs間的調(diào)控網(wǎng)絡。紅圈為高危DEIRGs, 綠圈為低危DEIRGs ,藍三角為DETFs;紅線為正相關(guān), 綠線為負相關(guān)。圖2 預后相關(guān)DEIRGs和DETFs間的調(diào)控網(wǎng)絡Fig.2 Regulatory network between prognosis related DEIRGs and DETFs
2.4 風險預測模型的構(gòu)建 通過對20個預后相關(guān)DEIRGs行R“step”函數(shù)和多因素Cox回歸分析,篩選出其中15個用于構(gòu)建風險預測模型。在該模型中,VEGFD、SFTPA2、SEMA3A、GAST、STC1、CCL26、CXCL8為高風險基因(HR>1),SLURP1、IL36A、PDGFRB、BIRC5、PGLYRP4、TNFRSF19、IL17RD、AVPR2為低風險基因(HR<1)。模型計算公式為RiskScore =(0.530859772×VEGFD)+(0.208685511×SFTPA2)+(0.087666745×SEMA3A)+(0.012001686×GAST)+(0.009443492×STC1)+(0.007784836×CCL26)+(0.001318513×CXCL8)+(-0.001600693×SLURP1)+(-0.014374813×IL36A)+(-0.016585009×PDGFRB)+(-0.020523714×BIRC5)+(-0.024620582×PGLYRP4)+(-0.1003187×TNFRSF19)+(-0.475553967×IL17RD)+(-1.032424×AVPR2),見表2。
表2 OSCC風險預測模型中15個預后相關(guān)DEIRGs的多因素Cox回歸分析Tab.2 Multivariate Cox regression analysis of 15 prognostic related DEIRGs in the OSCC risk prediction model
OSCC患者根據(jù)RiskScore的中位數(shù)分為高風險組(n=154)和低風險組(n=155)。Kaplan-Meier分析得出,高風險組和低風險組的5年生存率分別為0.271(95%CI0.173~0.426)和0.649(95%CI0.539~0.783),高風險組的預后明顯差于低風險組(P<0.001)(圖3A)。ROC曲線發(fā)現(xiàn)該模型的AUC值為0.732,表明其預測能力具有較高的準確性(圖3B)。
注:A. Kaplan-Meier生存分析;B. ROC曲線分析。圖3 OSCC患者的風險預測模型Fig.3 Risk prediction model for OSCC patients
2.5 風險預測模型的能力分析 結(jié)合臨床病理特征后行單因素Cox回歸分析,結(jié)果顯示年齡(P=0.008)、腫瘤分期(P<0.001)、T分期(P=0.002)和RiskScore(P<0.001)與預后相關(guān)(圖4A)。進一步行多因素Cox回歸分析,結(jié)果表明年齡(P=0.001)和RiskScore(P<0.001)與預后獨立相關(guān)(圖4B)。ROC曲線分析顯示,相比于傳統(tǒng)的臨床病理特征,該模型具有更好的準確性優(yōu)勢(AUC=0.717)(圖4C)。
注:A:單因素Cox回歸分析;B:多因素Cox回歸分析。紅色為高危因素;綠色為低危因素。C:ROC曲線評估模型的準確性優(yōu)勢。圖4 風險預測模型的能力分析Fig.4 Analysis of the Capability of Risk Prediction Models
2.6 風險預測模型的相關(guān)性分析 相關(guān)性分析結(jié)果表明,男性患者中PDGFRB和BIRC5的表達水平較高;G1和G2時PGLYRP4和IL36A的表達水平較高,G3和G4時AVPR2和IL17RD的表達水平較高;Ⅲ期和Ⅳ期時CXCL8、BIRC5、SEMA3A、GAST、STC1和RiskScore的水平較高;T3和T4期時STC1的表達水平較高,AVPR2的表達水平較低(P<0.05)(圖5)。這些結(jié)果表明,DEIRGs基因的異常調(diào)節(jié)與OSCC的發(fā)展密切相關(guān)。
注:A~B.性別;C~F.分化程度;G~L.腫瘤分期;M~N. T分期。圖5 風險預測模型與臨床病理特征的相關(guān)性Fig.5 Correlation between risk prediction model and clinical pathological features
為了確定模型是否與OSCC患者的TIME相關(guān),利用TIMER數(shù)據(jù)庫分析了RiskScore與TIME中免疫細胞浸潤間的關(guān)系。Pearson檢驗結(jié)果發(fā)現(xiàn),RiskScore 與B細胞(Cor=-0.180,P=0.002)和CD4+T細胞(Cor=-0.127,P=0.026)呈負相關(guān),與CD8+T細胞、樹突狀細胞、巨噬細胞和中性粒細胞無相關(guān)性(P>0.05)(圖6)。
注:A. B細胞;B. CD4+T細胞;C. CD8+T細胞;D. 樹突狀細胞;E. 巨噬細胞;F. 中性粒細胞。圖6 風險預測模型與腫瘤免疫細胞浸潤的相關(guān)性Fig.6 Correlation between risk prediction model and tumor immune cell infiltration
風險分層對于預測惡性腫瘤患者的預后和治療決策至關(guān)重要。目前,對于OSCC患者預后的預測和治療的選擇主要基于美國癌癥分期聯(lián)合委員會(AJCC)發(fā)布的TNM分期以及美國國立綜合癌癥網(wǎng)絡(NCCN)發(fā)布的腫瘤臨床實踐指南,但臨床工作中發(fā)現(xiàn)即使在具有相同或相似TNM分期和治療方式的患者中,預后也存在顯著差異[8-9]。腫瘤免疫靶點治療藥物的出現(xiàn)改善了部分晚期OSCC患者的生存率,并且通過增強免疫應答、刺激腫瘤特異性免疫、打破免疫耐受或重新激活免疫細胞等方式識別并殺死腫瘤細胞[10-11],這種治療方式涉及代謝、炎性反應和TIME等多種復雜機制的改變。考慮到腫瘤細胞異型性甚至癌變往往發(fā)生于炎性細胞密集浸潤的TIME中[12],因此本研究期望通過探討OSCC中免疫相關(guān)基因組和TIME的變化,提供關(guān)于預測患者預后和發(fā)現(xiàn)免疫治療潛在靶點的重要依據(jù)。
本研究在OSCC的差異表達基因中共發(fā)現(xiàn)了330個DEIRGs。富集分析表明,其中涉及的主要生物學特征為細胞因子、JAK-STAT信號通路以及PI3K-Akt信號通路。細胞因子可以引起人體TIME或免疫系統(tǒng)的變化,并且在OSCC中激活的免疫細胞已被證實可通過分泌炎性細胞因子促進腫瘤細胞的免疫逃逸[13-14]。JAK-STAT信號通路參與調(diào)節(jié)免疫系統(tǒng),影響腫瘤細胞的分化、增殖、凋亡[15-16]。PI3K/Akt信號通路中關(guān)鍵因子的異?;罨纱龠MOSCC細胞的侵襲和轉(zhuǎn)移,并與患者的腫瘤分化程度、腫瘤分期和淋巴結(jié)轉(zhuǎn)移密切相關(guān)[17]。此外,本研究在DETFs和DEIRGs的調(diào)控網(wǎng)絡中發(fā)現(xiàn)了28個DETFs和16個預后相關(guān)的DEIRGs之間存在調(diào)控關(guān)系,其中BIRC5、SEMA3G、IL17RD和CTLA4可能是該網(wǎng)絡中的核心基因。因此,DEIRGs及其所涉及的生物學特征在OSCC和免疫調(diào)節(jié)中發(fā)揮著重要功能,對于分析腫瘤的發(fā)展或制定治療措施具有參考價值。
盡管近期的研究已經(jīng)確定了一些可以改善OSCC診斷或治療的生物標志物,但由于OSCC的高復發(fā)率和不良預后,研究仍需要探索潛在的生物標志物以便精準地明確OSCC患者的預后情況,這將有助于根據(jù)每位OSCC患者的不同預后風險采取個性化的治療措施。因此,本研究構(gòu)建了一個包含15個預后相關(guān)DEIRGs的風險預測模型,該模型中的部分DEIRGs如SEMA3A、CXCL8和BIRC5等基因已經(jīng)被研究證明與OSCC密切相關(guān)[18-20],這些DEIRGs具有成為免疫治療靶點或預后生物標志物的潛力。本研究同時評估了該模型的準確性和臨床價值。與低危組相比,模型中高危組患者的預后明顯較差,且高危組的腫瘤分期更晚,表明該模型不僅能預測患者的預后情況,還能預測 OSCC 的進展。ROC曲線顯示模型的AUC為0.732,證明該模型具有較高的診斷準確性。Cox回歸分析證實該模型為OSCC患者的獨立預后因素,ROC曲線進一步明確了該模型與傳統(tǒng)的臨床病理特征相比具有更好的準確性優(yōu)勢。
本研究還分析了模型與免疫細胞浸潤的相關(guān)性,以反映OSCC中TIME的狀態(tài)。研究發(fā)現(xiàn)RiskScore與B細胞和CD4+T細胞呈負相關(guān),可以看出隨著RiskScore的增加機體的免疫功能逐漸受損,這可能導致TIME的失衡。以上結(jié)論證實了該模型具有較高的風險分層能力,對治療決策具有較高的指導價值。但本研究仍存在一些局限性。首先,該研究使用了來自多個數(shù)據(jù)庫的大樣本量數(shù)據(jù)集,但仍需進行更廣泛的驗證。其次,還需要進行體內(nèi)和體外實驗研究,以闡明模型中15個預后相關(guān)DEIRGs的具體分子調(diào)控機制。
綜上所述,本研究基于DEIRGs構(gòu)建了一個較為精確的風險預測模型,其中15個預后相關(guān)的DEIRGs充當重要角色。這些發(fā)現(xiàn)為理解OSCC的免疫機制提供了新的視角,也為臨床醫(yī)生選擇個性化治療策略提供幫助,以提高OSCC患者的生存率。
利益沖突:所有作者聲明無利益沖突
作者貢獻聲明
王錦航:數(shù)據(jù)獲取,統(tǒng)計分析,論文撰寫;彭士雄:數(shù)據(jù)獲取,統(tǒng)計分析;楊凱成:數(shù)據(jù)獲取,參與撰寫;陳彥平:研究構(gòu)思,論文審核;崔子峰:課題設(shè)計,論文撰寫,論文終審