王力業(yè), 高鶯, , 田淳
1.山西醫(yī)科大學口腔醫(yī)學院·口腔醫(yī)院,山西 太原(030001); 2.山西醫(yī)科大學第一醫(yī)院口腔科,山西 太原(030001)
口腔鱗狀細胞癌(oral squamous cell carcinoma,OSCC)是常見癌癥類型,約占所有口腔惡性腫瘤的90%[1-2]。在OSCC 治療中的關鍵是探索新的可靠的分子標志物提高癌癥患者的早期診斷,并識別和定位耐藥機制。生物信息學的發(fā)展使基因表達譜被廣泛應用于識別生物標志物。通過訪問不同類型的數(shù)據(jù)庫,包括大規(guī)模的臨床信息、基因測序和表達水平,可進行各種類型癌癥的標準化分析[3]。篩選腫瘤組織和正常組織中差異表達基因(differentially expressed genes,DEGs)將有助于進一步闡明OSCC 的發(fā)病機制,并可能為早期診斷和治療提供有希望的生物標志物或靶點。影響OSCC預后的中樞基因尚未完全確定,大多數(shù)研究只針對數(shù)據(jù)庫中的單個基因,關于聯(lián)合遺傳模型預測預后的研究較少。因此,本研究嘗試利用聯(lián)合遺傳模型尋找OSCC 預后的關鍵基因,為在臨床預測OSCC 患者預后提供理論依據(jù)。
從美國國家生物技術信息中心創(chuàng)建并維護的基因表達數(shù)據(jù)庫(Gene Expression Omnibus,GEO)數(shù)據(jù)庫中獲取OSCC 相關的三個芯片數(shù)據(jù)GSE23558、GSE37991、GSE30784,其中包括73 例OSCC 和50 例癌旁樣本。數(shù)據(jù)集中均使用人類口腔組織樣本,均包括健康組和對照組。利用GEO 數(shù)據(jù)庫提供的GEO2R 在線工具和維恩在線軟件對芯片數(shù)據(jù)進行差異表達分析,顯著差異表達基因的判定標準為|log(差異倍數(shù))|≥1、P<0.05,并進行可視化。
為了對DEGs 進行全面的注釋,采用R/bioconductor 的“clusterProfiler”程序包進行基因本體論(gene ontology,GO)富集分析和京都基因與基因組百科全書(the kyoto encyclopedia of genes and genomes,KEGG)富集分析。篩選標準是落在單個term 上差異基因,按照富集程度的值進行排列。
DEGs 相互作用使用STRING(http://string-db.org/)在線數(shù)據(jù)庫進行分析。將數(shù)據(jù)導入Cytoscape軟件并繪制網(wǎng)絡圖,用MCODE 插件對蛋白互作網(wǎng)絡中的模塊進行檢測,找出蛋白互作網(wǎng)絡中的集群即高度互連的區(qū)域,找出核心基因。
使用Kaplan Meier-plotter 網(wǎng)站工具評估核心差異基因在頭頸部鱗狀細胞癌中的總生存率,隨后利用GEPIA(http://gepia.cancer-pku.cn/)網(wǎng)站對與預后相關的核心基因進行進一步驗證,P<0.05 為差異有統(tǒng)計學意義。
通過對三個數(shù)據(jù)集的分析,共篩選出212 差異性基因,與正常組織相比,OSCC 中包括74 個上調(diào)和138 個下調(diào)差異性基因(表1)。
GO 功能注釋顯示DEGs 主要參與了信號轉導、細胞粘附細胞增殖的正調(diào)控、炎癥反應等生物學過程。DEGs 主要分布于細胞外來體、胞外區(qū)、蛋白質(zhì)的細胞外基質(zhì)等,參與到鈣離子結合、肝素結合、受體結合、細胞因子活性等(圖1)。DEGs 進行KEGG 通路分析,結果顯示主要富集在癌癥通路、細胞因子-細胞因子受體相互作用通路、細胞外基質(zhì)受體相互作用、精氨酸和脯氨酸代謝、組氨酸 代謝、PPAR 信號通路(圖2)。
表1 口腔鱗狀細胞癌的差異表達基因Table 1 Venn diagrams of differentially expressed genes of OSCC
Figure 1 Gene ontology enrichment analysis results of differentially expressed genes in OSCC圖1 口腔鱗狀細胞癌的差異表達基因的基因本體論分析結果
Figure 2 Differentially expressed genes in OSCC are involved in metabolic pathways圖2 口腔鱗狀細胞癌的差異表達基因參與的代謝途徑
使用STRING 在線軟件進行分析,得到蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡,將數(shù)據(jù)輸入Cytoscape 軟并獲得蛋白互作網(wǎng)絡圖,隨后使用MCODE 插件進行模塊化分析(degree cutoff = 2,node score cutoff =0.2,k-core = 2,max= 100)最終獲得16 個核心基因(圖3)。
Figure 3 Constructed protein-protein interaction network of differentially expressed genes in OSCC圖3 口腔鱗狀細胞癌的差異基因蛋白質(zhì)互作網(wǎng)絡圖
利用Kaplan-Meier 在線工具分析差異基因的預后信息,顯示16 個核心基因中有6 個基因高表達,與不良生存率顯著相關(P<0.05),這6 個基因分別是:極光激酶A(aurora kinase A,AURKA)、極光激酶B(aurora kinase B,AURKB)、細胞凋亡抑制因子5(baculoviral IAP repeat containing 5,BIRC5)、細胞分裂周期蛋白6(cell division cycle 6,CDC6)、E2F 轉錄因子7(E2F transcription factor 7,E2F7)、泛素樣含PHD 和環(huán)指域蛋白1(ubiquitin-like with PHD and ring finger domains 1,UHRF1)(圖4)。隨后,利用GEPIA 挖掘癌癥組織和正常組織之間6 個基因表達水平。結果顯示,與正常組織相比,AURKA、AURKB、BIRC5、CDC6、E2F7、UHRF1 等6 個核心基因在癌癥組中均表達較高(P<0.05)(圖5)。
隨著生物信息學發(fā)展,人們逐漸加深了對OSCC 的認知,Zheng 等[4]通過生物信息學分析OSCC腫瘤組織和相鄰正常組織臨床樣本的微陣列,得到與OSCC 相關的15 個核心差異基因,并通過定量逆轉錄聚合酶鏈反應進一步檢測OSCC 腫瘤與非腫瘤之間的關系。Zhang 等[5]通過生物信息學分析識別OSCC 中異常甲基化的差異基因,結果顯示這些基因在調(diào)節(jié)免疫應答過程中被富集,主要參與PI3K-AKT 和EMT 通路。本研究整合了來自多個數(shù)據(jù)集芯片數(shù)據(jù)以識別OSCC 中生物標志物,與單一數(shù)據(jù)集分析進行比較結果相對準確可靠。
Figure 4 The prognostic information of the core genes in OSCC圖4 口腔鱗狀細胞癌核心基因的預后信息
Figure 5 Validation of the expression levels of critical genes in OSCC圖5 驗證口腔鱗狀細胞癌核心基因表達水平
本研究使用GEO 數(shù)據(jù)庫下載了三個基因芯片用于OSCC 的生物信息學分析與整合最終獲取16個核心基因,其中與口腔癌患者生存率密切相關的候選基因有6個:AURKA、AURKB、BIRC5、CDC6、E2F7、UHRF1。對以上基因進行文獻檢索,證實上述基因與OSCC 的發(fā)生、轉移及預后密切相關。BIRC5、UHRF1 主要參與細胞凋亡的抑制。BIRC5被認為是迄今發(fā)現(xiàn)最強的凋亡抑制因子[6]。BIRC5 編碼的蛋白Survivin 可以直接抑制末端效應酶caspase-3 和caspase-7 的活性,抵抗特定刺激引起的細胞凋亡,還可以與細胞周期蛋白依賴性激酶CDK-4 和CDK-2 相互作用抑制凋亡信號通路[7]。Troiano 等[8]對OSCC 和正??谇火つみM行生物信息學和組織學的綜合分析,發(fā)現(xiàn)Survivin 蛋白在腫瘤組織中呈高表達,與腫瘤細胞較高的增殖率以及較差的預后密切相關。UHRF1 是泛素樣含PHD 和環(huán)指域蛋白家族的主要成員之一,能夠調(diào)節(jié)DNA 甲基化和組蛋白修飾之間的相互連接,是重要的表觀遺傳學調(diào)控因子。Polepalli 等[9]研究認為UHRF1 通過抑癌基因啟動子高甲基化,沉默抑癌基因的轉錄,從而抑制其凋亡,參與腫瘤的侵襲及轉移。UHRF1 基因的敲除可降低壞死受體相互作用激酶-3 的關鍵調(diào)節(jié)因子啟動子的甲基化水平,導致壞死受體相互作用激酶-3 表達增加,從而導致腫瘤生長下降,其潛在的分子機制有助于開發(fā)腫瘤治療藥物[10]。Baroudi 等[11]發(fā)現(xiàn)頭頸部鱗狀細胞癌中UHRF1 的過表達與腫瘤侵襲性相關,不僅有助于評估患者預后,還具有對患者進行臨床分期的診斷價值。
AURKA、AURKB、CDC6、E2F7 與細胞有絲分裂密切相關。Guo 等[12]采用RNA 干擾技術靶向抑制E2F7 在腫瘤中的表達進而發(fā)揮抑癌作用,該實驗同時還發(fā)現(xiàn)在TF-target 調(diào)控網(wǎng)絡中,E2F7 可以調(diào)控CDC6 基因表達。E2F7 過表達不僅與癌癥預后相關,還會引起頭頸部鱗狀細胞癌治療中蒽環(huán)類藥物的耐藥性。Hazar-Rethinam 等[13]證明E2F7定位錯誤引起RacGAPI 和Sphk1/S1P 表達下調(diào),該網(wǎng)絡與耐藥性直接相關,并且觀察到E2F7 可能是通過AURKB 作用于RacGAPI 從而激發(fā)耐藥。Saen-Ponce 等[14]進一步研究發(fā)現(xiàn),E2F7 從細胞核輸出后錯誤定位于細胞質(zhì)中是通過病理激活XPO1 途徑所致,并且在頭頸部鱗狀細胞癌異種移植模型中使用XPO1 抑制劑實現(xiàn)了對蒽環(huán)類藥物耐藥性的逆轉,逆轉E2F7 核輸出可能為頭頸部鱗狀細胞癌的治療及提高生存率提供機會。CDC6 是DNA 復制必不可少的蛋白,其與其他調(diào)節(jié)蛋白結合形成“復制前復合體”,與腫瘤發(fā)生發(fā)展密切相關,同樣可以促進細胞的惡性轉化[15]。Feng 等[16]使用RTPCR 及免疫組化檢測發(fā)現(xiàn)CDC6 的mRNA 和蛋白在正??谇火つぶ械捅磉_,在癌前病變和OSCC 中呈高表達。研究發(fā)現(xiàn)OSCC 淋巴結轉移患者中CDC6表達明顯高于非轉移性癌,為了進一步證實與舌鱗癌細胞的關系,該研究者敲除CDC6 的基因后發(fā)現(xiàn)舌鱗癌Tca8113 細胞的增殖、遷移受到了明顯的抑制[17]。AURKA、AURKB 均屬于有絲分裂絲氨酸/蘇氨酸激酶家族,AURKA 參與維持細胞中心粒和染色體的精確分離過程,AURKB 主要參與細胞從G2期到M 期的分裂,二者的過度表達均與腫瘤不良預后相關。Huang 等[18]發(fā)現(xiàn)AURKA 基因多態(tài)性表達水平和吸煙聯(lián)合檢測可以作為OSCC 診斷和預后的重要分子標志物,吸煙伴AURKA 基因高表達者患口腔癌風險顯著增加,對篩選口腔癌高危人群有一定參考價值。Yang 等[19]證明AURKA的抑制劑MLN8237 一方面可以通過抑制AURKA在Thr288 的自磷酸化,導致細胞不能正常分裂,另一方面誘導細胞周期在G2/M 期停止細胞出現(xiàn)衰老,從而抑制腫瘤細胞的生長。已有學者觀察到在頭頸部腫瘤中AURKB 的高表達與細胞增殖和淋 巴 結 轉 移 相 關[20]。Bertran-Alamillo 等[21]使 用AURKB 抑制劑處理可降低pH3 水平,從而觸發(fā)G1/S 阻滯和多倍體化,在生長停滯和多倍體化之后,抑制AURKB 會引發(fā)不同類型腫瘤細胞的衰老或死亡。Togar 等[22]對OSCC 細胞的基因進行了篩選并評級,最后識別出AURKB 對OSCC 細胞增殖至關重要,進一步實驗中對AURKB 進行藥理抑制發(fā)現(xiàn)抑制癌癥細胞增殖。Boeckx 等[23]比較西妥昔單抗敏感細胞和耐藥頭頸部鱗狀細胞癌細胞系的全基因組mRNA 表達,發(fā)現(xiàn)高表達的AURKB 通過RAS-MARK 信號通路作用導致耐藥性的發(fā)生,因此使用AURKB 抑制劑阻斷該通路可能是在治療中克服西妥昔單抗耐藥性的新策略。AURKA、AURKB是癌癥治療中另一重要靶點。
綜上所述,本研究利用生物信息學工具分析了OSCC 組織和相鄰正常組織的基因表達差異,找出與腫瘤相關的核心基因,并對這些關鍵基因參與癌癥的發(fā)生、發(fā)展和預后的關系進行挖掘。但一些基因在OSCC 中的功能及其分子機制有待進一步研究,同樣需要用大量獨立樣本集對這些標志物進行驗證。