趙北川 宣若恒 楊桂濤 凌耿強(qiáng) 夏之柏
膠質(zhì)瘤因其高死亡率給社會(huì)和家庭均帶來(lái)了沉重負(fù)擔(dān),識(shí)別更好的生物標(biāo)志物,建立更準(zhǔn)確的預(yù)后模型在神經(jīng)膠質(zhì)瘤的臨床診治中具有十分重要的意義。碳水化合物磺基轉(zhuǎn)移酶6(carbohydrate sulfotransferase 6,CHST6)作為一種催化硫酸基轉(zhuǎn)移酶的編碼基因,通過(guò)參與子宮內(nèi)膜癌[1]、甲狀腺癌[2]、腎透明細(xì)胞癌[3]的糖酵解途徑,影響腫瘤的侵襲,其高表達(dá)與上述腫瘤較差的預(yù)后密切相關(guān)。同時(shí)在GRANT等[4]對(duì)437例胰腺癌患者和1922例正常人的全外顯子測(cè)序中發(fā)現(xiàn),CHST6在胰腺癌患者中具有罕見(jiàn)的破壞性變異富集。目前,CHST6基因在正常組織和神經(jīng)膠質(zhì)瘤,以及不同神經(jīng)膠質(zhì)瘤臨床亞型中的表達(dá)差異水平及預(yù)后作用仍不清楚,本研究旨在分析CHST6基因在神經(jīng)膠質(zhì)瘤中的差異表達(dá)情況,以及與膠質(zhì)瘤的預(yù)后關(guān)系,并探尋膠質(zhì)瘤可能的新作用靶點(diǎn),為進(jìn)一步探尋神經(jīng)膠質(zhì)瘤的發(fā)展機(jī)制及治療提供參考。
1.1 研究對(duì)象各種神經(jīng)膠質(zhì)瘤類型的RNA表達(dá)數(shù)據(jù)和臨床數(shù)據(jù)來(lái)自癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov)和中國(guó)膠質(zhì)瘤基因組圖譜(Chinese Glioma Genome Atlas,CGGA)(http://www.cgga.org.cn/)325和693數(shù)據(jù)庫(kù)。正常樣本RNA表達(dá)數(shù)據(jù)則來(lái)自于基因型和基因表達(dá)量關(guān)聯(lián)數(shù)據(jù)庫(kù)(The Genotype-Tissue Expression,GTEx)中標(biāo)簽為“Brain”的1152例樣本。
神經(jīng)膠質(zhì)瘤樣本納入標(biāo)準(zhǔn):①行顱腦腫瘤切除術(shù);②病理診斷明確,世界衛(wèi)生組織(World health organization,WHO)分級(jí)為II~I(xiàn)V級(jí)的彌漫性膠質(zhì)瘤。排除標(biāo)準(zhǔn):①生存狀態(tài)及術(shù)后生存時(shí)間缺失或不完整;②生存期<60 d或隨訪<60 d;③異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)突變、1號(hào)染色體短臂和19號(hào)染色體長(zhǎng)臂(1p19q)共缺失和O6-甲基鳥(niǎo)嘌呤-DNA-甲基轉(zhuǎn)移酶(methyl guanine methyl transferase,MGMT)甲基化狀態(tài)、性別、年齡或分級(jí)信息缺失或不明確。共獲得TCGA數(shù)據(jù)庫(kù)501例樣本、CGGA_325和CGGA_693數(shù)據(jù)庫(kù)共703例樣本。所有樣本將轉(zhuǎn)錄本定量(Fragments Per Kilobase of exon model per Million mapped fragments,F(xiàn)PKM)格式的RNA-seq表達(dá)數(shù)據(jù)轉(zhuǎn)換為TPM(Transcripts Per Million)格式,其中CGGA_325和CGGA_693 RNA-seq表達(dá)數(shù)據(jù)合并時(shí)行批次校正處理。
1.2 統(tǒng)計(jì)學(xué)方法使用GraphPad Prism 9.4.1軟件行統(tǒng)計(jì)分析。用Mann-WhitneyU檢驗(yàn)對(duì)比非正態(tài)分布定量變量CHST6在正常樣本與膠質(zhì)瘤樣本間差異表達(dá)情況。
以TCGA數(shù)據(jù)庫(kù)中501例膠質(zhì)瘤樣本為訓(xùn)練集,CGGA數(shù)據(jù)庫(kù)中703例膠質(zhì)瘤樣本為外部驗(yàn)證集,以TCGA數(shù)據(jù)庫(kù)中CHST6表達(dá)值中位數(shù)為界限,分為CHST6高表達(dá)風(fēng)險(xiǎn)組與低表達(dá)風(fēng)險(xiǎn)組,行Kaplan-Meier預(yù)后差異分析及外部驗(yàn)證。并分別做受試者工作特征(receiver operating characteristic,ROC)曲線分析,以ROC曲線下面積(area under curve,AUC)值>0.7表示其有較好的辨別能力,分別驗(yàn)證CHST6在TCGA與CGGA數(shù)據(jù)庫(kù)中對(duì)膠質(zhì)瘤患者1年、3年、5年生存期預(yù)測(cè)的準(zhǔn)確性。
使用R語(yǔ)言survival軟件包,基于單因素和多因素比例風(fēng)險(xiǎn)(Cox)回歸分析TCGA數(shù)據(jù)庫(kù)中CHST6表達(dá)量與性別、年齡、WHO腫瘤分級(jí)、IDH突變狀態(tài)、1p19q共缺失情況和MGMT甲基化狀態(tài)等不同臨床特征是否為神經(jīng)膠質(zhì)瘤患者的獨(dú)立預(yù)后因素,檢驗(yàn)水準(zhǔn)α=0.05。基于結(jié)果構(gòu)建改進(jìn)預(yù)測(cè)模型的列線圖(Nomogram)和預(yù)測(cè)模型的校準(zhǔn)圖(Calibration),以C指數(shù)(C-Index)>0.75認(rèn)為該模型有較好預(yù)測(cè)效度。以納入CHST6表達(dá)量的預(yù)測(cè)模型為改進(jìn)模型,未納入CHST6表達(dá)量的預(yù)測(cè)模型為對(duì)照模型,以CGGA數(shù)據(jù)庫(kù)為驗(yàn)證集,帶入TCGA數(shù)據(jù)庫(kù)改進(jìn)模型與對(duì)照模型參數(shù),Bootstrap法比較納入CHST6后,AUC變化情況。
1.3 功能與免疫差異分析使用R語(yǔ)言GSEA軟件包對(duì)TCGA數(shù)據(jù)庫(kù)CHST6高低表達(dá)組(中位值為界限)行差異基因集富集分析(Gene Set Enrichment Analysis,GSEA)。通過(guò)R語(yǔ)言ClusteProfiler軟件包分別作為基因本體(Gene Ontology,GO)功能注釋分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,獲得差異富集的分子功能(molecular function,MF)、生物學(xué)過(guò)程(biological process,BP)和細(xì)胞成分(cellular component,CC),以及KEGG通路富集情況。
2.1 臨床特征本研究納入501例TCGA數(shù)據(jù)庫(kù)和703例CGGA數(shù)據(jù)庫(kù)膠質(zhì)瘤樣本,臨床特征見(jiàn)表1,1152例GETx數(shù)據(jù)庫(kù)正常樣本。結(jié)果顯示,膠質(zhì)瘤樣本CHST6表達(dá)值[TCGA 4.27(2.37,8.73),CGGA 6.61(3.37,18.17)]較正常樣本[GTEx 1.81(1.32,2.23)]明顯升高(TCGAvs.GTEx,Z=2.457,P<0.001;CGGAvs.GTEx,Z=4.800,P<0.001)。
表1 神經(jīng)膠質(zhì)瘤樣本臨床特征分組情況 例
2.2 預(yù)后分析Kaplan-Meier分析顯示,CHST6高表達(dá)風(fēng)險(xiǎn)組(中位值4.277為界限)在TCGA數(shù)據(jù)庫(kù)和CGGA數(shù)據(jù)庫(kù)中總生存期均較低表達(dá)風(fēng)險(xiǎn)組明顯下調(diào)(P<0.0001)。見(jiàn)圖1。ROC曲線分析顯示,CHST6在TCGA與CGGA數(shù)據(jù)庫(kù)中對(duì)膠質(zhì)瘤患者1年、3年、5年生存期預(yù)測(cè)有較好的準(zhǔn)確性(TCGA 1年AUC 0.820,3年AUC 0.748,5年AUC 0.760;CGGA 1年AUC 0.724,3年AUC 0.769,5年AUC 0.760)。見(jiàn)圖2。單因素與多因素Cox回歸分析結(jié)果顯示,CHST6與年齡、WHO級(jí)別、IDH突變狀態(tài)、1p19q共缺失等臨床特征共同作為膠質(zhì)瘤患者的獨(dú)立預(yù)后因素。見(jiàn)表2。根據(jù)多因素Cox回歸分析結(jié)果,我們將上述獨(dú)立預(yù)后因素共同納入預(yù)后分析,構(gòu)建出改進(jìn)預(yù)測(cè)模型的列線圖(Nomogram)和預(yù)測(cè)模型的校準(zhǔn)圖(Calibration)(C-Index 0.885,95%CI0.862~0.908)。見(jiàn)圖3、4。納入CHST6表達(dá)量的改進(jìn)模型較未納入CHST6表達(dá)量的對(duì)照模型有著更高的效度(TCGA改進(jìn)模型1、3、5年AUC 0.900,0.886,0.850;對(duì)照模型AUC 0.874,0.865,0.822;改進(jìn)模型vs.對(duì)照模型d=0.036±0.004,SE=0.002,P=0.007;CGGA改進(jìn)模型1、3、5年AUC:0.719,0.758,0.752;對(duì)照模型AUC:0.663,0.666,0.668;改進(jìn)模型vs.對(duì)照模型d=0.087±0.004,SE=0.002,P=0.001)。見(jiàn)圖5。
圖1 TCGA與CGGA Kaplan-Meier分析曲線 mOS,中位總生存期(median overall survival);HR,風(fēng)險(xiǎn)比率(hazard ratio);95%CI,95%置信區(qū)間(95% confidence interval)
圖2 TCGA與CGGA ROC分析曲線 TCGA與CGGA ROC模型閾值=4.277,AUC>0.7認(rèn)為有較好的預(yù)測(cè)效度
圖3 TCGA數(shù)據(jù)庫(kù)樣本預(yù)測(cè)模型列線圖
圖4 TCGA數(shù)據(jù)庫(kù)樣本預(yù)測(cè)模型校準(zhǔn)圖 C-index,C指數(shù);Observed OS,觀測(cè)生存期;Nomogram-predicted OS,預(yù)測(cè)生存期。C指數(shù)>0.75,表示有著較好的預(yù)測(cè)效度
表2 TCGA數(shù)據(jù)庫(kù)樣本多因素Cox回歸分析結(jié)果
2.3 功能與免疫差異分析GSEA富集分析顯示,CHST6高表達(dá)風(fēng)險(xiǎn)組GO主要富集于胞外結(jié)構(gòu)(圖6紅色標(biāo)記),如含膠原蛋白的細(xì)胞外基質(zhì)、細(xì)胞外基質(zhì)組織、細(xì)胞外結(jié)構(gòu)組織、外部封裝結(jié)構(gòu)組織、細(xì)胞粘附的正向調(diào)節(jié)(表3);KEGG主要富集于PI3KAkt信號(hào)通路、神經(jīng)活性配體-受體相互作用、黏著斑、細(xì)胞因子-細(xì)胞因子受體相互作用、人乳頭瘤病毒感染(圖7紅色標(biāo)記,表4),此外還有癌癥中的蛋白聚糖(proteoglycans in cancer)、ECM-受體相互作用(ECM-receptor interaction)等通路(圖7紫色標(biāo)記)。
圖6 TCGA數(shù)據(jù)庫(kù)GSEA GO富集差異分析結(jié)果 MF,分子功能(molecular function);BP,生物學(xué)過(guò)程(biological process);CC,細(xì)胞成分(cellular component)
圖7 TCGA數(shù)據(jù)庫(kù)GSEA KEGG富集差異分析結(jié)果 注:Count,核心基因的數(shù)目,值越大,差異富集越顯著;GeneRatio,核心基因(Count)與該GO條目中包含表達(dá)數(shù)據(jù)集中的基因數(shù)目(setSize)的比值,值越大,差異富集越顯著;qValue,校準(zhǔn)后P值
表3 TCGA數(shù)據(jù)庫(kù)GSEA GO差異富集分析結(jié)果
表4 TCGA數(shù)據(jù)庫(kù)GSEA KEGG差異富集分析結(jié)果
CHST6編碼一種催化硫酸基轉(zhuǎn)移酶,相關(guān)研究認(rèn)為CHST6通過(guò)參與糖酵解途徑,與子宮內(nèi)膜癌[1]、甲狀腺癌[2]、腎透明細(xì)胞癌[3]的預(yù)后密切相關(guān)。LIU等[5]在對(duì)能量代謝基因的研究中發(fā)現(xiàn),CHST6與低級(jí)別膠質(zhì)瘤的預(yù)后密切相關(guān)。本研究經(jīng)TCGA與CGGA數(shù)據(jù)庫(kù)Kaplan-Meier分析和ROC曲線分析,證實(shí)CHST6對(duì)膠質(zhì)瘤患者預(yù)后有較高的預(yù)測(cè)價(jià)值。多因素Cox回歸分析提示,CHST6與年齡、WHO級(jí)別、IDH突變狀態(tài)和1p19q共缺失情況,共同作為膠質(zhì)瘤的獨(dú)立預(yù)后因素,并繪制生存預(yù)測(cè)列線圖,提示臨床可通過(guò)該模型圖,對(duì)膠質(zhì)瘤患者預(yù)后進(jìn)行預(yù)判,從而指導(dǎo)臨床盡早展開(kāi)針對(duì)性治療。
糖酵解作為一種成熟的代謝途徑,在癌癥的進(jìn)展中發(fā)揮著重要作用。其中異檸檬酸脫氫酶(IDH)作為參與糖酵解途徑的關(guān)鍵限速酶之一,其突變情況是膠質(zhì)瘤的重要臨床預(yù)后特征,相比于IDH野生型,IDH突變型膠質(zhì)瘤有著更低水平的糖酵解和更好的預(yù)后[6-7]。近年來(lái)的研究發(fā)現(xiàn),在膠質(zhì)母細(xì)胞瘤中,腫瘤細(xì)胞主要通過(guò)激活PI3K/AKT信號(hào)通路促進(jìn)腫瘤細(xì)胞的有氧糖酵解[7-11]。本研究的GSEA分析結(jié)果也顯示,CHST6高表達(dá)風(fēng)險(xiǎn)組在PI3K-Akt信號(hào)通路有顯著的富集,這提示CHST6可能通過(guò)PI3K-Akt信號(hào)通路,促進(jìn)膠質(zhì)瘤的糖酵解水平,并在臨床特征中表現(xiàn)為更少的IDH突變,從而影響膠質(zhì)瘤患者的預(yù)后。
在本研究的GSEA分析中,CHST6高表達(dá)風(fēng)險(xiǎn)組還在神經(jīng)活性配體-受體相互作用、黏著斑、細(xì)胞因子-細(xì)胞因子受體相互作用、ECM-受體相互作用中顯著富集。在神經(jīng)活性配體-受體相互作用中,近年來(lái)的研究發(fā)現(xiàn),其中的GABRP與胰腺癌的趨化因子信號(hào)、巨噬細(xì)胞浸潤(rùn)和腫瘤進(jìn)展有關(guān)[12],小膠質(zhì)細(xì)胞和骨髓來(lái)源的髓系細(xì)胞分泌的CCL5,與NF1相關(guān)的低級(jí)別膠質(zhì)瘤(LGGs)生長(zhǎng)有關(guān)[13]。細(xì)胞外基質(zhì)(extracellular matrix,ECM)是腫瘤微環(huán)境中的一個(gè)高度活躍的部分,影響腫瘤細(xì)胞的行為和轉(zhuǎn)移能力,對(duì)腫瘤的診斷、靶向治療、預(yù)后有著重要意義[14-15]。其中,ECM可通過(guò)抑制腫瘤細(xì)胞死亡和抗原的釋放、感染腫瘤抗原提呈、影響效應(yīng)T細(xì)胞啟動(dòng)和激活、調(diào)節(jié)T細(xì)胞的遷移,干擾T細(xì)胞識(shí)別和殺死癌細(xì)胞等免疫途徑,導(dǎo)致免疫系統(tǒng)逃逸和腫瘤生長(zhǎng)[16]。黏著斑是一種重要的細(xì)胞外基質(zhì)粘附結(jié)構(gòu),對(duì)于細(xì)胞的伸展,粘附,遷移和免疫應(yīng)答都有不可替代的作用,在腫瘤的轉(zhuǎn)移和侵襲性中具有重要作用[17-18]。以上GSEA分析表明,CHST6在通過(guò)PI3K-Akt信號(hào)通路促進(jìn)腫瘤細(xì)胞的生長(zhǎng)增殖同時(shí),還可能通過(guò)神經(jīng)活性配體的內(nèi)分泌途徑,促進(jìn)神經(jīng)膠質(zhì)瘤的生長(zhǎng);通過(guò)影響ECM和細(xì)胞外基質(zhì)結(jié)構(gòu)如黏著斑,促進(jìn)膠質(zhì)瘤的生長(zhǎng)和免疫系統(tǒng)逃逸。
綜上所述,本研究揭示了CHST6的高表達(dá)與神經(jīng)膠質(zhì)瘤患者的預(yù)后不良相關(guān),并制作出的風(fēng)險(xiǎn)因素預(yù)后列線圖。此外,本研究還對(duì)CHST6造成神經(jīng)膠質(zhì)瘤患者不良預(yù)后的可能通路進(jìn)行分析,表明CHST6可能作為神經(jīng)膠質(zhì)瘤免疫治療的潛在靶點(diǎn)。但CHST6作用于糖酵解的調(diào)控機(jī)制、與膠質(zhì)瘤相關(guān)通路的作用機(jī)制仍需進(jìn)一步在膠質(zhì)瘤細(xì)胞系及腫瘤樣本中驗(yàn)證。