昝雨欣,丁 妍
1. 湖北醫(yī)藥學(xué)院生物醫(yī)藥研究院(湖北十堰 442000) 2. 湖北醫(yī)藥學(xué)院附屬太和醫(yī)院生命科學(xué)研究所(湖北十堰 442000) 3. 胚胎干細(xì)胞研究湖北省重點(diǎn)實(shí)驗(yàn)室(湖北十堰 442000)
喉癌是耳鼻喉科最常見(jiàn)的惡性腫瘤,好發(fā)于歐洲地區(qū)[1]。目前喉癌的治療手段包括手術(shù)、放化療及生物治療等,雖然有一定療效,但喉癌患者的5年生存率僅為30%~40%,且大多數(shù)患者在確診時(shí)往往處于晚期,多死于腫瘤復(fù)發(fā)或轉(zhuǎn)移[2]。因此,亟待找到一種有效可靠的方法對(duì)喉癌患者進(jìn)行早期診治,以改善預(yù)后。
腫瘤干細(xì)胞是一類具有自我更新和分化能力的異質(zhì)性腫瘤細(xì)胞,在腫瘤的增殖、轉(zhuǎn)移和復(fù)發(fā)中發(fā)揮重要作用[3]。通過(guò)人工智能和深度學(xué)習(xí)算法,建立一種描述腫瘤干細(xì)胞的新方法,稱為腫瘤干性指數(shù),用于描述腫瘤細(xì)胞和干細(xì)胞之間的相似程度。研究表明,mRNAsi 可能是腫瘤患者生存、分類和疾病進(jìn)展的有效指標(biāo)[4]。目前對(duì)喉癌的認(rèn)識(shí)主要依賴于頭頸部相關(guān)研究,其獨(dú)立研究相對(duì)缺乏,且基于生物信息學(xué)探索喉癌與mRNAsi 潛在聯(lián)系的研究較少。本研究采用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis, WGCNA),基于大規(guī)模數(shù)據(jù)集識(shí)別喉癌潛在相關(guān)基因模塊,旨在識(shí)別mRNAsi 基因潛在生物標(biāo)志物或治療靶點(diǎn),并驗(yàn)證與喉癌免疫預(yù)后相關(guān)的新生物標(biāo)志物[5]。
從癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(kù)(https://www.cancer.gov/ccg/research/genome-sequencing/tcga)中獲取11 個(gè)正常樣本和112 個(gè)喉癌樣本的FPKM 數(shù)據(jù)類型和相應(yīng)臨床特征的RNA 測(cè)序數(shù)據(jù)。采用R 軟件的limma 軟件包篩選喉癌和正常組織之間的差異表達(dá)基因,錯(cuò)誤發(fā)現(xiàn)率(false discovery rate, FDR)<0.05 且|log(FC)|>1 被認(rèn)為是顯著的。
WGCNA 是一種評(píng)估基因之間相關(guān)性并將高度相關(guān)基因分類到同一模塊的方法。首先通過(guò)差異表達(dá)分析進(jìn)行處理,以過(guò)濾無(wú)關(guān)信息。拓?fù)渲丿B測(cè)度用于識(shí)別共表達(dá)基因模塊,以降低網(wǎng)絡(luò)對(duì)虛假連接的敏感性。通過(guò)將聚類樹(shù)切割成分支,將具有高度絕對(duì)相關(guān)性的基因聚類到相同模塊。只有超過(guò)50 個(gè)基因才會(huì)被定義為一個(gè)模塊。具有較高相關(guān)性的模塊將被合并(r<0.25),每個(gè)模塊被分配不同顏色進(jìn)行可視化。
為了評(píng)估模塊的顯著性,將基因與樣本性狀之間的相關(guān)性計(jì)算為基因顯著性(gene significance,GS)。模塊自身基因和基因表達(dá)譜之間的相關(guān)性被定義為模塊成員(module membership, MM)。選擇mRNAsi 和表觀遺傳調(diào)控的mRNAsi(EGERmRNAsi)作為臨床表型進(jìn)一步分析。|r|>0.3 被認(rèn)為具有相關(guān)性。
首先進(jìn)行單因素Cox 回歸分析,以評(píng)估預(yù)后相關(guān)模塊的mRNA,再采用LASSO 回歸分析確定mRNA 系數(shù),采用以下算法計(jì)算患者的風(fēng)險(xiǎn)得分:
風(fēng)險(xiǎn)評(píng)分=∑ni=coefi×mRNA 表達(dá)
采用Rtsne 和ggplot2 R 軟件包,在mRNAs 特征表達(dá)的前提下進(jìn)行主成分分析(principal component analysis, PCA),以區(qū)分喉癌患者的高低風(fēng)險(xiǎn)隊(duì)列。
在CellMiner 數(shù)據(jù)庫(kù)(https://discover.nci.nih.gov/cellminer/home.do)[6]下載常用藥物敏感性和基因表達(dá)數(shù)據(jù),與上述風(fēng)險(xiǎn)系數(shù)進(jìn)行相關(guān)性分析,通過(guò)R 語(yǔ)言中impute、limma、ggpubr、ggplot2 包篩選具有高評(píng)分的基因和對(duì)應(yīng)的藥物。
采用R 包GSVA 對(duì)免疫細(xì)胞和功能的基因表達(dá)譜進(jìn)行單樣本基因集富集分析(single sample gene set enrichment analysis,ssGSEA),采用ggpubr 包將結(jié)果可視化。同時(shí)通過(guò)腫瘤免疫功能障礙與排斥(Tumor Immune Dysfunction and Exclusion, TIDE)數(shù)據(jù)庫(kù)(http://tide.dfci.harvard.edu)下載腫瘤評(píng)分?jǐn)?shù)據(jù),采用limma、ggpubr 軟件包得到高低風(fēng)險(xiǎn)基因與腫瘤免疫逃逸結(jié)果。
利用clusterProfiler 包對(duì)高低風(fēng)險(xiǎn)表達(dá)組進(jìn)行基因集富集分析(gene set enrichment analysis,GSEA),下載MSigDB 數(shù)據(jù)庫(kù)中的“c2.cp.kegg.v7.5.1.entrez.gmt”和“c5.go.v7.5.1.symbols.gmt”基因集,進(jìn)行基因本體(gene ontology, GO)分析及京都基因和基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析,將FDR <0.05 設(shè)置為閾值。
采用R 4.0.3 軟件進(jìn)行統(tǒng)計(jì)分析。分類變量采用χ2檢驗(yàn),連續(xù)變量采用秩檢驗(yàn)。采用Pearson相關(guān)性分析評(píng)估關(guān)鍵基因的表達(dá)與藥物敏感性之間的相關(guān)性。以P<0.05 為差異具有統(tǒng)計(jì)學(xué)意義。
為進(jìn)一步探討與mRNAsi 相關(guān)的功能基因,計(jì)算正常組織和喉癌組織之間存在的顯著差異,紅色為高表達(dá)基因,綠色為低表達(dá)基因。共篩選得到5 302 個(gè)差異表達(dá)基因,并繪制火山圖,見(jiàn)圖1-A。其中,前14 個(gè)差異表達(dá)基因熱圖見(jiàn)圖1-B,KRT4、CRNIN、MAL等基因在正常組織中高表達(dá)(P<0.05)。
圖1 喉癌的差異表達(dá)基因Figure 1. Differentially expressed genes in laryngeal cancer注:A. 火山圖;B. 前14個(gè)差異表達(dá)基因熱圖。
選擇上述差異表達(dá)基因作為WGCNA 分析的輸入端數(shù)據(jù),構(gòu)建一個(gè)基因共表達(dá)網(wǎng)絡(luò)并從中識(shí)別與mRNAsi / EREG-mRNAsi 顯著關(guān)聯(lián)的基因模塊,軟閾值(β=5,R2=0.9)用于保證無(wú)規(guī)模網(wǎng)絡(luò),最終獲得30 個(gè)符合要求的模塊。然后,對(duì)相關(guān)模塊的全基因表達(dá)水平進(jìn)行分析,以確定相應(yīng)模塊與mRNAsi 之間的相關(guān)性,見(jiàn)圖2-A。在30 個(gè)模塊中,紫色模塊與喉癌樣本的mRNAsi分值呈顯著正相關(guān)(MS=0.53,P<0.05),同時(shí)隨機(jī)選擇另一種正相關(guān)的模塊(淺黃色模塊)加以驗(yàn)證。紫色模塊內(nèi)共有7 個(gè)顯著差異表達(dá)基因(GS >0.5 且MM >0.7),見(jiàn)圖2-B。淺黃色模塊內(nèi)共有4 個(gè)顯著差異表達(dá)基因(GS >0.3 且MM >0.8),見(jiàn)圖2-C。最后,選擇上述淺黃色模塊差異表達(dá)基因(MTHFD2、LINC01932、AL121761.1、TBX2)和紫色模塊差異表達(dá)基因(NEK2、KPNA2、ASF1B、MCM10、RFC5、FAM72A、DBF4)共11個(gè)基因作為喉癌的關(guān)鍵基因。
圖2 WGCNA篩選的重要模塊與基因Figure 2. The important modules and genes for WGCNA screening注:A. 模塊-mRNAsi(EREG-mRNAsi)關(guān)聯(lián)圖;B. 紫色模塊散點(diǎn)圖;C. 淺黃色模塊散點(diǎn)圖。
進(jìn)一步繪制11 個(gè)基因在正常組織和腫瘤組織中的表達(dá)趨勢(shì)圖,發(fā)現(xiàn)淺黃色、紫色模塊中的候選基因在喉癌中大多上調(diào)(P<0.05),見(jiàn)圖3-A。模塊內(nèi)基因相關(guān)性分析結(jié)果顯示,紫色模塊協(xié)同表達(dá)關(guān)系較強(qiáng)的基因?qū)灿袃蓪?duì),包括FAM72A和NEK2(r=0.77,P<0.05)、MCM10和RFC5(r=0.71,P<0.05)。淺黃色模塊協(xié)同表達(dá)關(guān)系較強(qiáng)的基因?qū)灿腥龑?duì),包括MTHFD2和TBX2(r=0.74,P<0.05)、LINC01932和TBX2(r=0.71,P<0.05)、LINC01932和MTHFD2(r=0.70,P<0.05),見(jiàn)圖3-B。對(duì)11 個(gè)基因進(jìn)行Cox 回歸和LASSO 回歸分析,構(gòu)建預(yù)后基因風(fēng)險(xiǎn)模型:風(fēng)險(xiǎn)分?jǐn)?shù)=TBX2×0.021+MTHFD2×0.085,見(jiàn)圖3-C。PCA 分析結(jié)果表明,所得的風(fēng)險(xiǎn)評(píng)分有效區(qū)分了高低風(fēng)險(xiǎn)組,見(jiàn)圖3-D。通過(guò)化療藥物數(shù)據(jù)庫(kù)篩選出前12 個(gè)結(jié)果進(jìn)行可視化,結(jié)果顯示TBX2基因與維莫非尼(Vemurafenib)(r=0.587,P<0.001)、達(dá)拉菲尼(Dabrafenib)(r=0.439,P<0.001)均呈正相關(guān);MTHFD2基因與奧沙利鉑(Oxaliplatin)(r=0.368,P=0.004)呈正相關(guān),與凡德他尼(Vandetanib)(r=-0.354,P=0.005)呈負(fù)相關(guān),見(jiàn)圖3-E。
圖3 喉癌與mRNAsi相關(guān)的關(guān)鍵基因表達(dá)Figure 3. Expression of key genes related to mRNAsi in laryngeal cancer注:A. 模塊基因表達(dá)水平;B. 模塊基因的相關(guān)性;C. 單變量Cox回歸分析;D. 基于風(fēng)險(xiǎn)評(píng)分的PCA圖和t-SNE圖;E. 化療藥物篩選;*P<0.05,***P<0.001。
探索風(fēng)險(xiǎn)評(píng)分與mRNAsi 的相關(guān)性,其與RNAss 呈正相關(guān)(r=0.35,P<0.05),與DNAss 的相關(guān)性差異無(wú)統(tǒng)計(jì)學(xué)意義(r=0.073,P=0.44),見(jiàn)圖4-A。同時(shí)檢測(cè)風(fēng)險(xiǎn)評(píng)分與腫瘤免疫逃逸的相關(guān)性,發(fā)現(xiàn)高低風(fēng)險(xiǎn)組存在顯著差異。TIDE 是一種模擬腫瘤免疫逃逸機(jī)制的計(jì)算方法,以預(yù)測(cè)樣本對(duì)免疫檢查點(diǎn)抑制劑的反應(yīng)。兩基因構(gòu)建的低風(fēng)險(xiǎn)組TIDE 明顯高于高風(fēng)險(xiǎn)組(P<0.001),見(jiàn)圖4-B。在低風(fēng)險(xiǎn)隊(duì)列中,漿細(xì)胞樣樹(shù)突狀細(xì)胞(plasmacytoid dendritic cells,pDCs)和輔助性T 細(xì)胞2(T helper 2 cell,Th2)的比例增加,見(jiàn)圖4-C。在低風(fēng)險(xiǎn)隊(duì)列中,趨化因子受體(chemokine receptor,CCR)、人類白細(xì)胞抗原(human leukocyte antigen,HLA)及T 細(xì)胞共刺激(T cell co-stimulation) 3 種免疫功能均有差異表達(dá),見(jiàn)圖4-D。
圖4 喉癌特異性腫瘤微環(huán)境Figure 4. Laryngeal carcinoma specific tumor microenvironment注:A. 風(fēng)險(xiǎn)曲線與mRNAsi相關(guān)性;B. 風(fēng)險(xiǎn)評(píng)分與TIDE的關(guān)系;C、D. 低風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)之間免疫相關(guān)細(xì)胞與途徑的ssGSEA富集分?jǐn)?shù)比較隊(duì)列;*P<0.05,**P<0.01,***P<0.001。
GO 功能富集分析結(jié)果顯示,MTHFD2主要富集于表皮細(xì)胞分化,TBX2主要富集于結(jié)締組織替代的正向調(diào)節(jié),且二者與角化作用、角化細(xì)胞分化密切相關(guān),見(jiàn)圖5-A。KEGG 信號(hào)通路富集分析結(jié)果顯示,MTHFD2主要富集于嗅覺(jué)信號(hào)轉(zhuǎn)導(dǎo)途徑,TBX2主要富集于同種異體移植排斥反應(yīng)和蛋白酶體,見(jiàn)圖5-B。
圖5 MTHFD2與TBX2基因功能富集分析Figure 5. Functional enrichment analysis of MTHFD2 and TBX2 genes注:A. GO富集分析;B. KEGG富集分析。
喉癌的發(fā)病率較低,每10 萬(wàn)人中僅有1.5 例發(fā)病,臨床較少見(jiàn)[1]。隨著人口老齡化,喉癌的發(fā)病率逐漸上升,喉癌患者在生物學(xué)行為、治療反應(yīng)和預(yù)后方面的表現(xiàn)具有較大異質(zhì)性。年齡、腫瘤分級(jí)和TNM 分類等常見(jiàn)的預(yù)后因素?zé)o法準(zhǔn)確預(yù)測(cè)喉癌患者的預(yù)后,因而聚焦該疾病具有重要的臨床實(shí)際意義。
腫瘤干細(xì)胞是惡性腫瘤無(wú)限增殖和復(fù)發(fā)的來(lái)源。然而,早期研究缺乏對(duì)癌癥干細(xì)胞的統(tǒng)一描述,喉癌的個(gè)體化治療進(jìn)展緩慢。而mRNAsi 作為量化腫瘤患者腫瘤干性的指標(biāo)被開(kāi)發(fā)出來(lái),可以更加高效便捷地探索與腫瘤干性相關(guān)的基因。腫瘤干細(xì)胞在喉癌中的研究仍處于初級(jí)階段。Prince 等曾報(bào)道在原發(fā)性喉癌中檢測(cè)到CD44+癌細(xì)胞,雖然其占比不到10%,但在體外具有很強(qiáng)的成瘤能力[7]。研究表明,CD133 是喉癌干細(xì)胞的標(biāo)志物之一,可以為靶向治療提供證據(jù)[8]。這表明腫瘤干細(xì)胞標(biāo)記物與喉癌治療相結(jié)合,可能對(duì)喉癌患者的長(zhǎng)期預(yù)后產(chǎn)生積極影響,并為癌癥治療帶來(lái)新思路。本研究構(gòu)建了一個(gè)基于WGCNA 的mRNAsi 的喉癌預(yù)測(cè)模型,得到了關(guān)鍵基因MTHFD2和TBX2,為喉癌的機(jī)制研究提供了新見(jiàn)解。
mRNAsi 相關(guān)基因的藥敏數(shù)據(jù)將有助于喉癌患者的治療。與MTHFD2相關(guān)的前兩種化療藥物維莫非尼和達(dá)拉菲尼均為有效的絲氨酸/蘇氨酸蛋白激酶選擇性抑制劑,且前者在甲狀腺乳頭狀癌患者中顯示出抗腫瘤活性,后者可抑制成釉細(xì)胞癌與甲狀腺癌進(jìn)展[9-10]。奧沙利鉑和凡德他尼是兩種與TBX2相關(guān)的化療藥物,奧沙利鉑是一種DNA 合成抑制劑,可以誘導(dǎo)免疫原細(xì)胞死亡,并對(duì)喉癌細(xì)胞具有抑制作用[11];凡德他尼是一種多通道腫瘤信號(hào)傳導(dǎo)抑制劑,通過(guò)調(diào)節(jié)細(xì)胞依賴性DNA 修復(fù)和腫瘤微環(huán)境,使頭頸鱗癌對(duì)光動(dòng)力學(xué)治療過(guò)敏,從而導(dǎo)致體內(nèi)腫瘤生長(zhǎng)的顯著增加[12]。雙基因共相關(guān)的達(dá)沙替尼是一種具有抗實(shí)體腫瘤雙重SRC/ABL 激酶抑制劑,抑制SRC 磷酸化反應(yīng)誘導(dǎo)細(xì)胞周期停止和凋亡,從而抑制腫瘤進(jìn)展[13]。這些藥物是喉癌患者的潛在新治療選擇。
腫瘤微環(huán)境的免疫細(xì)胞數(shù)量和比例隨著腫瘤進(jìn)展而變化,在某些情況下可以對(duì)抗癌治療產(chǎn)生反應(yīng)。豐富的抗腫瘤浸潤(rùn)免疫細(xì)胞(pDCs 和Th2)富集在低風(fēng)險(xiǎn)隊(duì)列中,pDCs 和Th2 細(xì)胞均是參與免疫反應(yīng)并在抗腫瘤反應(yīng)中發(fā)揮積極作用的主要細(xì)胞。在扁桃體上皮中,pDCs 不僅可以通過(guò)識(shí)別病毒并釋放干擾素幫助抵御病毒感染,而且能夠在不受微生物過(guò)度刺激的情況下啟動(dòng)免疫。因此,pDCs可以被認(rèn)為是扁桃體上皮的“守護(hù)者”,幫助維護(hù)免疫系統(tǒng)的穩(wěn)定和健康[14]。此外,臨床證據(jù)顯示,使用pDCs 的藥物分類法識(shí)別惡性腫瘤治療敏感的患者,可有效提高治療反應(yīng)率[15]。以上均提示pDCs 在喉癌進(jìn)展中發(fā)揮抑制作用。在喉鱗狀細(xì)胞癌患者中,Th2 型轉(zhuǎn)錄因子和細(xì)胞因子的表達(dá)占優(yōu)勢(shì)[16]。經(jīng)批準(zhǔn)的免疫檢查點(diǎn)抑制劑可減少免疫逃逸,從而改善癌癥患者的臨床預(yù)后。臨床研究發(fā)現(xiàn)一例特殊的轉(zhuǎn)移性喉癌病例,患者在PD-1 抑制劑治療失敗后,出現(xiàn)了縱隔腹膜后淋巴結(jié)和骨質(zhì)進(jìn)行性疾病,但在經(jīng)過(guò)免疫檢查點(diǎn)抑制劑藥物治療后,其骨痛、腹膜后淋巴結(jié)和胸腔淋巴結(jié)病癥狀得到緩解,臨床狀況也得到改善,這與TIDE 評(píng)分結(jié)果一致[17],有助于開(kāi)發(fā)個(gè)性化和精確的免疫治療方案。在功能富集研究中,發(fā)現(xiàn)關(guān)鍵基因與角化細(xì)胞密切相關(guān),而喉癌前病變喉角化癥是一種常見(jiàn)的粘膜病變,起源于造血干細(xì)胞的細(xì)胞缺陷會(huì)導(dǎo)致喉角化狀癌發(fā)生,這提示未來(lái)治療可通過(guò)免疫學(xué)對(duì)惡性腫瘤進(jìn)行早期監(jiān)測(cè)[18]。
本研究存在一定局限性,盡管采用了生物信息學(xué)分析,但實(shí)際臨床研究的樣本量較少,降低了研究的可行性。綜上所述,TBX2和MTHFD2基因可成為喉癌早期檢測(cè)、診斷和預(yù)后評(píng)估的潛在生物標(biāo)志物。將WGCNA模塊與mRNAsi相結(jié)合,通過(guò)精準(zhǔn)定位這些模塊中的關(guān)鍵基因,可以確定在癌癥進(jìn)展中起關(guān)鍵作用的潛在治療靶點(diǎn),這些特定基因或途徑的靶向可能為開(kāi)發(fā)喉癌新的治療策略和確定藥物靶點(diǎn)提供參考。