王圓圓 義勇軍
廣州市第一人民醫(yī)院南沙醫(yī)院(廣州 511457)
星型膠質(zhì)細(xì)胞瘤約占顱內(nèi)腫瘤的24%,是顱內(nèi)最常見(jiàn)的膠質(zhì)瘤[1]。臨床上大多星型膠質(zhì)細(xì)胞瘤只需要手術(shù)切除,然而快速增長(zhǎng)的星型膠質(zhì)細(xì)胞瘤會(huì)導(dǎo)致顱內(nèi)高壓、腦水腫和腦疝等嚴(yán)重的并發(fā)癥。目前,對(duì)于星型膠質(zhì)細(xì)胞瘤的干預(yù)手段非常有限,主要是由于對(duì)于星型角質(zhì)細(xì)胞瘤的發(fā)生發(fā)展機(jī)制的認(rèn)識(shí)仍然處于探索階段。相關(guān)研究表明,星形膠質(zhì)細(xì)胞瘤與遺傳有明顯的相關(guān)性[2- 3]。然而目前,關(guān)于星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展的分子機(jī)制仍然不明確,很難為臨床治療提供指導(dǎo)。
近年來(lái),基因芯片技術(shù)已經(jīng)廣泛應(yīng)用于疾病機(jī)制的探究,通過(guò)對(duì)基因芯片數(shù)據(jù)進(jìn)行生物信息學(xué)分析,可以預(yù)測(cè)參與疾病發(fā)生發(fā)展過(guò)程中重要的分子和通路,并結(jié)合臨床預(yù)后生存資料對(duì)其預(yù)后價(jià)值和診斷價(jià)值進(jìn)行評(píng)價(jià)。因此我們通過(guò)生物信息學(xué)分析探究星型膠質(zhì)細(xì)胞瘤的預(yù)后生物標(biāo)志物,從而為星型膠質(zhì)細(xì)胞瘤提供新的治療靶點(diǎn)和預(yù)后生物標(biāo)志物。
本文分析的星型膠質(zhì)細(xì)胞瘤基因芯片數(shù)據(jù)集均來(lái)自于GEO(gene expression omnibus,GEO)數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)。所有數(shù)據(jù)集中的基因芯片數(shù)據(jù)均基于GPL570[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array。將4個(gè)數(shù)據(jù)集中的人腦組織的樣本分為星形膠質(zhì)細(xì)胞瘤組(Astroglioma組)和正常組(Normal組),包括:162個(gè)星形膠質(zhì)細(xì)胞瘤樣本和32個(gè)正常腦組織樣本。不同數(shù)據(jù)集中樣本的分布,見(jiàn)表1。
表1 數(shù)據(jù)集中樣本的分布
用R語(yǔ)言將原始基因芯片數(shù)據(jù)按照不同的分組進(jìn)行合并,通過(guò)R語(yǔ)言中的sva包處理來(lái)自不同數(shù)據(jù)集樣本之間的批次效應(yīng)(batch effects)。利用R語(yǔ)言中的limma包對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,并用ggplot2包可視化[4- 5]。應(yīng)用limma包對(duì)處理后的基因表達(dá)數(shù)據(jù)進(jìn)行差異分析,從而得到星型膠質(zhì)細(xì)胞瘤組和正常組之間的差異表達(dá)基因(differentially expressed genes,DEGs),篩選標(biāo)準(zhǔn):|log2(Fold change)|>1,P值<0.05。并用熱圖展示差異表達(dá)基因在不同組間的表達(dá)情況,用火山圖展示差異表達(dá)基因的分布情況。
GO(Gene ontology,GO)分析可從生物過(guò)程(biological process,BP)、細(xì)胞組成 (cellular component,CC) 和分子功能(molecular function,MF)三個(gè)方面對(duì)差異表達(dá)基因進(jìn)行功能富集分析[6]。我們應(yīng)用R語(yǔ)言中的enrichplot包對(duì)差異表達(dá)基因進(jìn)行GO分析,并通過(guò)ggplot 2包可視化。KEGG(kyoto encyclopedia of genes and genomes,KEGG)分析是基于KEGG數(shù)據(jù)庫(kù)對(duì)差異表達(dá)基因進(jìn)行通路富集分析[7],我們應(yīng)用KEGG數(shù)據(jù)庫(kù)對(duì)差異表達(dá)基因進(jìn)行通路富集分析,并用R語(yǔ)言進(jìn)行可視化。為了彌補(bǔ)對(duì)差異表達(dá)基因進(jìn)行富集分析的不足,我們使用clusterProfiler包對(duì)所有基因的表達(dá)數(shù)據(jù)進(jìn)行了GSEA(gene set enrichment analysis,GSEA)分析。
STRING數(shù)據(jù)庫(kù)可預(yù)測(cè)蛋白質(zhì)之間的相互調(diào)控關(guān)系[8- 9]。我們應(yīng)用STRING數(shù)據(jù)庫(kù)構(gòu)建差異表達(dá)基因之間的相互調(diào)控關(guān)系,并通過(guò)Cytoscape進(jìn)行可視化。利用Cytoscape中的cytoscapehubba插件分析得到20個(gè)Hub基因。
為了評(píng)價(jià)Hub基因診斷價(jià)值和預(yù)后價(jià)值,我們下載TCGA(the cancer genome atlas,TCGA)數(shù)據(jù)庫(kù)(https://cancergenome.nih.gov/)中關(guān)于星型膠質(zhì)細(xì)胞的基因表達(dá)數(shù)據(jù)和臨床預(yù)后資料,其中包含167例不同生存時(shí)間的人樣本。使用pROC包構(gòu)建Hub基因的ROC曲線,篩選Hub基因中AUC>0.8的進(jìn)行展示。利用COX回歸模型對(duì)Hub基因與患者預(yù)后進(jìn)行評(píng)價(jià),篩選HR值最有意義的基因進(jìn)行總生存分析(overall survival,OS)。
用R語(yǔ)言合并不同數(shù)據(jù)集中的基因芯片數(shù)據(jù),并且對(duì)基因芯片數(shù)據(jù)進(jìn)行預(yù)處理。PCA分析結(jié)果顯示(圖1A、B),預(yù)處理后樣本聚類更加清晰,樣本可靠。密度圖結(jié)果表明(圖1C、D),預(yù)處理后兩組基因表達(dá)擬合程度高,可用于后續(xù)的生物信息學(xué)分析。我們通過(guò)R語(yǔ)言中的limma包總共分析得到1 043個(gè)差異表達(dá)基因,其中:526個(gè)上調(diào)基因和517個(gè)下調(diào)基因。通過(guò)熱圖展示了差異表達(dá)基因在不同組中的表達(dá)情況,可見(jiàn)差異表達(dá)基因在不同分組中表達(dá)差異明顯(圖2A)。應(yīng)用火山圖展示了所有基因的分布情況,并標(biāo)注了差異表達(dá)基因和Hub基因在所有基因中的位置(圖2B)。
圖1 原始數(shù)據(jù)預(yù)處理A.預(yù)處理前PCA分析;B.預(yù)處理后的PCA分析;C. 預(yù)處理前密度圖;D.預(yù)處理后密度圖
圖2 差異表達(dá)基因的情況A.差異表達(dá)基因的熱圖;B.差異表達(dá)基因分布的火山圖
為了探索差異表達(dá)基因富集的功能區(qū)域,我們對(duì)差異表達(dá)基因進(jìn)行GO分析和KEGG分析。差異表達(dá)基因GO分析結(jié)果表明(圖3A):BP結(jié)果主要集中在突觸組織的調(diào)節(jié)、突觸結(jié)構(gòu)或活性的調(diào)節(jié)、突觸小泡循環(huán)、神經(jīng)遞質(zhì)轉(zhuǎn)運(yùn)、調(diào)節(jié)神經(jīng)遞質(zhì)水平、囊泡介導(dǎo)運(yùn)輸?shù)恼{(diào)節(jié)、突觸信號(hào)轉(zhuǎn)導(dǎo)的調(diào)控、化學(xué)突觸傳遞的調(diào)節(jié)和突觸組織等過(guò)程;CC結(jié)果表明差異表達(dá)基因主要位于轉(zhuǎn)運(yùn)囊泡膜、膠原蛋白細(xì)胞外基質(zhì)、突觸后膜、軸突部分、運(yùn)輸小泡和神經(jīng)細(xì)胞體;MF主要與GABA-A受體活性、GABA受體活性、配體門(mén)控離子通道活性、門(mén)控通道活動(dòng)、離子門(mén)控通道活性、離子通道活性、底物特異度通道活性和被動(dòng)跨膜轉(zhuǎn)運(yùn)蛋白活性等功能相關(guān)。KEGG分析結(jié)果表明差異表達(dá)基因主要富集于鈣信號(hào)通路、cAMP信號(hào)通路、細(xì)胞因子-細(xì)胞因子受體相互作用、MAPK信號(hào)通路、神經(jīng)活性配體-受體相互作用、PI3K-Akt信號(hào)通路、Rap1信號(hào)通路和Ras信號(hào)通路等通路(圖3B)。通過(guò)對(duì)所有基因進(jìn)行GSEA富集分析(圖3C),結(jié)果主要富集于細(xì)胞因子-細(xì)胞因子受體相互作用、JAK-STAT信號(hào)通路、逆行內(nèi)源性大麻素信號(hào)、神經(jīng)活性配體-受體相互作用、GABA能突觸和鈣信號(hào)通路等通路。
圖3 基因富集分析結(jié)果A.差異表達(dá)基因GO分析結(jié)果;B.差異表達(dá)基因KEGG分析結(jié)果;C.所有基因GSEA分析結(jié)果
將差異表達(dá)基因?qū)隨TRING數(shù)據(jù)庫(kù)得到差異表達(dá)基因之間的PPI,用Cytoscape可視化(圖4A),通過(guò)Cytoscape中的cytoHubba插件分析得到ADCY1、NPY1R、ANXA1、PENK、ADORA3、PRK1、SSTR2、APLNR、CCR1和CXCR4等20個(gè)hub基因(圖4B)。
圖4 PPI網(wǎng)絡(luò)和Hub基因
我們通過(guò)ROC曲線總共篩選得到8個(gè)診斷價(jià)值較高的基因:SST(AUC=0.863)、ADCY1(AUC=0.828)、C3AR1(AUC=0.842)、CXCL16(AUC=0.891)、GNB5(AUC=0.88)、GNG12(AUC=0.915)、GNG3(AUC=0.863)、OPRK1(AUC=0.837)、S1PR3(AUC=0.846)和SSTR2(AUC=0.839)。通過(guò)COX回歸模型和OS分析對(duì)Hub基因與預(yù)后關(guān)系評(píng)價(jià)的結(jié)果表明:STT(HR=1.63,95%CI:1.15~2.32,P=0.005)的高表達(dá)與患者較差的預(yù)后強(qiáng)相關(guān)。
圖5 Hub基因的診斷價(jià)值和預(yù)后價(jià)值A(chǔ). Hub基因的ROC曲線;B. SST與患者預(yù)后的關(guān)系
星型膠質(zhì)細(xì)胞瘤是一種顱內(nèi)常見(jiàn)的腫瘤,主要病理特點(diǎn)為星形細(xì)胞的胞體較小,突起很少,膠質(zhì)纖維含量很少[10]。在星型膠質(zhì)細(xì)胞瘤的分子機(jī)制中,NF1的低表達(dá)、BRAF過(guò)表達(dá)、MAPK/Erk通路等在發(fā)揮的作用早已明確[11-13]。然而星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展的機(jī)制是一個(gè)錯(cuò)綜復(fù)雜的調(diào)控過(guò)程,因此很難對(duì)其分子機(jī)制的進(jìn)行全面的闡述。隨著星型膠質(zhì)細(xì)胞瘤分子機(jī)制的探究,靶向治療星型膠質(zhì)細(xì)胞瘤帶來(lái)了新的希望,然而對(duì)于分子機(jī)制認(rèn)識(shí)始終是靶向治療難以逾越的一道鴻溝。為了探究星型膠質(zhì)細(xì)胞瘤分子機(jī)制,以便探索星型膠質(zhì)細(xì)胞瘤新的治療靶點(diǎn),我們結(jié)合基因芯片數(shù)據(jù)和臨床預(yù)后生存資料進(jìn)行了生物信息學(xué)分析。
我們通過(guò)GO分析表明,差異表達(dá)基因主要通過(guò)影響了神經(jīng)突觸的作用而在星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展中發(fā)揮著重要的作用。通過(guò)KEGG分析發(fā)現(xiàn)星型膠質(zhì)細(xì)胞瘤的分子機(jī)制主要與鈣信號(hào)通路、cAMP信號(hào)通路、細(xì)胞因子-細(xì)胞因子受體相互作用、MAPK信號(hào)通路、神經(jīng)活性配體-受體相互作用、PI3K-Akt信號(hào)通路、Rap1信號(hào)通路和Ras信號(hào)通路等通路相關(guān)。GSEA分析主要富集于細(xì)胞因子-細(xì)胞因子受體相互作用、JAK-STAT信號(hào)通路、逆行內(nèi)源性大麻素信號(hào)、神經(jīng)活性配體-受體相互作用、GABA能突觸和鈣信號(hào)通路等通路。PI3K-Akt 信號(hào)通路主要通過(guò)促進(jìn)星型角質(zhì)細(xì)胞瘤的增殖增強(qiáng)腫瘤細(xì)胞的侵襲和轉(zhuǎn)移[14],與該信號(hào)通路作用類似,Ras信號(hào)通路作為細(xì)胞增殖的啟動(dòng)因子,也可促進(jìn)星型角質(zhì)細(xì)胞的增殖[15]。JAK-STAT信號(hào)通路主要與星型膠質(zhì)細(xì)胞瘤中的炎癥反應(yīng)相關(guān)[16]。絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)是細(xì)胞信號(hào)重要傳遞者,是一組能被不同的細(xì)胞外刺激激活的絲氨酸-蘇氨酸蛋白激酶。相關(guān)研究表明[17-19],MAPK信號(hào)通路與星型膠質(zhì)細(xì)胞瘤的增殖和侵襲性相關(guān),抑制該通路可抑制腫瘤的生長(zhǎng)。與其他腫瘤類似,細(xì)胞因子-細(xì)胞因子受體相互作用在星型膠質(zhì)細(xì)胞瘤分子機(jī)制中的作用已經(jīng)有了較為詳細(xì)的闡述[20- 21]。鈣信號(hào)通路和cAMP信號(hào)通路在星型膠質(zhì)瘤中的早已有研究報(bào)道[22- 25],然而關(guān)于其具體的分子機(jī)制有待進(jìn)一步的研究。以上的研究通過(guò)生物實(shí)驗(yàn)說(shuō)明我們生物信息學(xué)分析的結(jié)果真實(shí)可靠,具有一定的參考價(jià)值。除此之外,我們還發(fā)現(xiàn)Rap1信號(hào)通路有可能在星型膠質(zhì)細(xì)胞瘤的分子機(jī)制中發(fā)揮著重要的作用,有可能為星形膠質(zhì)細(xì)胞瘤分子機(jī)制的研究提供新的方向,值得我們進(jìn)一步的研究
我們通過(guò)構(gòu)建PPI,用Cytoscape中的cytoscapehubba分析得到20個(gè)Hub基因:ADCY1、NPY1R、ANXA1、PENK、ADORA3、PRK1、SSTR2、APLNR、CCR1和CXCR4等。我們通過(guò)對(duì)這些分子的診斷價(jià)值進(jìn)行評(píng)價(jià),發(fā)現(xiàn)SST、ADCY1、C3AR1、CXCL16、GNB5、GNG12、GNG3、OPRK1、S1PR3和SSTR2具有較高的診斷價(jià)值。相關(guān)研究表明[26- 29],S1PR1、GNG12和ANXA1在星型膠質(zhì)細(xì)胞中的表達(dá)高,但是與患者臨床預(yù)后無(wú)關(guān)。神經(jīng)營(yíng)養(yǎng)因子是通過(guò)表面SIP受體1(S1PR1)介導(dǎo)的,我們分析結(jié)果表明S1PR1在星型膠質(zhì)細(xì)胞瘤中高表達(dá),S1PR1可能通過(guò)調(diào)節(jié)神經(jīng)營(yíng)養(yǎng)因子而在星型膠質(zhì)細(xì)胞發(fā)生發(fā)展過(guò)程中發(fā)揮作用[28]。CXCR4可促進(jìn)星型膠質(zhì)細(xì)胞瘤的增殖和侵襲,但是其與患者的預(yù)后并未明顯相關(guān)性[27]。ADCY1不僅與星型膠質(zhì)細(xì)胞侵襲,也與患者預(yù)后相關(guān)[30]。星型膠質(zhì)細(xì)胞中C3補(bǔ)體表達(dá)增高,該補(bǔ)體激活可增加星型角質(zhì)細(xì)胞瘤與其他細(xì)胞的結(jié)合力[31- 32],從而促進(jìn)星型膠質(zhì)細(xì)胞瘤的侵襲和轉(zhuǎn)移。以上基因的相關(guān)研究與我們分析的結(jié)果相似,說(shuō)明我們的篩選的關(guān)鍵基因有一定參考價(jià)值。我們也通過(guò)生物信息學(xué)分析結(jié)果也表明ADORA3、SST、SSTR2、NPY1R、PENK、GNG3、NPY、C3AR1、OPRK1、APLNR、CCR1和CXCL16在星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展過(guò)程中有重要的作用,然而關(guān)于這些分子與星型膠質(zhì)細(xì)胞瘤關(guān)系仍然不清楚,這為我們進(jìn)行一步探究星型膠質(zhì)細(xì)胞瘤的機(jī)制提供了新的思路。然而關(guān)于SST、ADCY1、C3AR1、CXCL16、GNB5、GNG12、GNG3、OPRK1、S1PR3和SSTR2的診斷價(jià)值目前也未涉及,這為我們篩選星型膠質(zhì)細(xì)胞瘤的早期診斷標(biāo)志物提供了參考。
我們通過(guò)對(duì)Hub基因的診斷價(jià)值和預(yù)后價(jià)值進(jìn)行評(píng)估,發(fā)現(xiàn)SST不僅具有良好的診斷價(jià)值,而且與患者預(yù)后明顯相關(guān)。SST是生長(zhǎng)抑素家族的成員,該家族成員在多種腫瘤中發(fā)揮著重要的作用[33- 35]。目前關(guān)于該家族成員在星型膠質(zhì)細(xì)胞瘤中的研究表明[27],SST2的高表達(dá)與星型膠質(zhì)細(xì)胞瘤預(yù)后差相關(guān),而SST3和SST5的高表達(dá)提示患者預(yù)后良好。因此我們大膽推測(cè)SST的表達(dá)與星型膠質(zhì)細(xì)胞瘤的預(yù)后差相關(guān),可作為其預(yù)后生物標(biāo)志物。
綜上所述,我們通過(guò)聯(lián)合分析GEO數(shù)據(jù)庫(kù)TCGA數(shù)據(jù)庫(kù)中的基因芯片數(shù)據(jù)和臨床預(yù)后資料,發(fā)現(xiàn)SST在星形膠質(zhì)細(xì)胞瘤中既有良好的診斷價(jià)值,又與患者生存預(yù)后強(qiáng)相關(guān),有可能成為星型膠質(zhì)細(xì)胞瘤新的預(yù)后生物標(biāo)志物,通過(guò)通路富集分析發(fā)現(xiàn)了Rap1信號(hào)通路可能在星型膠質(zhì)細(xì)胞中發(fā)揮著重要的作用。這既為星型膠質(zhì)細(xì)胞瘤分子機(jī)制的研究提供了新的思路,又有助于開(kāi)發(fā)星形膠質(zhì)細(xì)胞瘤預(yù)防和治療的新策略。