董婧婷,衡立,康紹叁,劉健,田志崇,張立國,張金存,李治國,沈宏,曹鳳宏*
本研究價值:
本研究從基因、通路到預(yù)后的角度深入挖掘了與去勢抵抗性前列腺癌相關(guān)的基因,并發(fā)現(xiàn)CDC20、MAD2L1 和NUSAP1 與去勢抵抗性前列腺癌的發(fā)生、發(fā)展密切相關(guān),為去勢抵抗性前列腺癌的預(yù)防和治療提供了新的研究方向。
前列腺癌(prostate cancer,PCa)是癌癥相關(guān)死亡率第二高的惡性疾?。?],目前主要采取雄激素剝奪療法(androgen-deprivation therapy,ADT)進行治療[2]。據(jù)報道,10%~20%的PCa 患者對ADT 產(chǎn)生抵抗,最終演變?yōu)槿莸挚剐郧傲邢侔╟astration-resistant prostate cancer,CRPC),且中位生存期僅為14 個月[3],預(yù)后不良,死亡率極高[4]。已有研究發(fā)現(xiàn)在去勢狀態(tài)下雄激素受體(androgen receptor,AR)信號的傳導(dǎo)與CRPC潛在分子機制有關(guān)[5],但具體機制仍不十分清楚,且目前臨床上尚無有效治療CRPC 的方法。因此亟須尋找新的關(guān)鍵基因,為臨床診療提供新思路。
生物信息學(xué)是一門分析理解生物數(shù)據(jù)的學(xué)科,其可以在生物體表達的不同位置、不同通路中進行富集,從而發(fā)現(xiàn)與疾病相關(guān)聯(lián)的生物信息,還可根據(jù)基因本體論(GO)、京都基因和基因組百科全書(KEGG)和蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)綜合分析,獲取在癌癥相關(guān)疾病中較為穩(wěn)定的差異表達基因(differentially expressed genes,DEGs),是一種能有效發(fā)掘癌癥相關(guān)疾病基因表達譜的重要工具[6]。已有研究應(yīng)用生物信息學(xué)方法找到與PCa 相關(guān)的關(guān)鍵基因。SUN 等[7]通過生物信息學(xué)分析鑒定出ARHGEF38 等關(guān)鍵基因和PCa 進展相關(guān);SHEN 等[8]運用基因表達分析揭示了與PCa 預(yù)后相關(guān)的關(guān)鍵基因并提出靶向細胞周期通路可能與PCa 的預(yù)后和治療相關(guān);GU 等[9]采用生物信息學(xué)方法確定了TOP2A、CCNB2 等關(guān)鍵基因可促進PCa 的發(fā)展和轉(zhuǎn)移。為進一步找到和CRPC 發(fā)展密切的候選基因,本研究通過生物信息學(xué)方法挖掘與CRPC 進展相關(guān)的關(guān)鍵基因。
本研究結(jié)合CRPC 和PCa 樣本的基因表達譜,首先對數(shù)據(jù)集進行處理,篩選DEGs,分析DEGs 的功能和途徑以及疾病的信號通路。然后構(gòu)建PPI 網(wǎng)絡(luò),對重要模塊進行分析并篩選出具有生存意義的關(guān)鍵基因,本研究結(jié)果可為CRPC 發(fā)病機制、治療和預(yù)后的相關(guān)研究提供新思路。
1.1 數(shù)據(jù)收集 從國家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)(http://www.ncbi.nlm.nih.gov/) 的GEO(http://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫中下載微陣列數(shù)據(jù)集GSE32269。GSE32269 芯片由Affymetrix 公司GPL96 平臺檢測,包括29 例CRPC 樣本和22 例原發(fā)性PCa 樣本。
1.2 篩選DEGs 使用R 語言4.0.3 中的Affy 包[10],將normalize.method 設(shè) 置 為“quantiles”,bgcorrect.method 設(shè)置為“rma”,pmcorrect.method 設(shè)置為“pmonly”,summary.method 設(shè)置為“l(fā)iwong”,提取基因的表達量。然后采用t 檢驗得到兩組樣本基因表達量的P 值,利用Benjamini-Hochberg 錯誤發(fā)現(xiàn)率方法,調(diào)整P 值來降低假陽性率[11]。采用校正后P<0.05,差異倍數(shù)(fold change,F(xiàn)C)>1.5 作為截斷值的標(biāo)準,篩選CRPC 和原發(fā)性PCa 樣本之間的DEGs。
1.4 PPI 網(wǎng)絡(luò)和模塊分析 為預(yù)測蛋白質(zhì)之間物理和功能的相互作用,本研究使用STRING(https://string-db.org/)構(gòu)建DEGs 的PPI 網(wǎng)絡(luò)(互作評分>0.4)[16]。采用Cytoscape 3.7.2 版(http://cytoscape.org/download_old_versions.html)軟件進行可視化處理[17]。利用MCODE插件[18]對網(wǎng)絡(luò)進行模塊分析,較高分數(shù)的模塊在疾病的發(fā)展過程中具有重要意義。
1.5 鑒定關(guān)鍵基因 選擇滿足以下2 個約束條件的DEGs 作為關(guān)鍵基因:(1)該基因位于關(guān)鍵模塊中(模塊分數(shù)>40);(2)使用Cytoscape 軟件計算,同時符合最大鄰域分量(maximum neighborhood component,MNC)、 最 大 鄰 域 分 量 密 度(density of maximum neighborhood component,DMNC)和最大集團中心性(maximal clique centrality,MCC)前30 位的基因。
1.6 關(guān)鍵基因的生存分析和受試者工作特征(ROC)曲線分析 癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)(http://gepia.cancer-pku.cn/index.html)數(shù)據(jù)庫擁有龐大的PCa 樣本量,能提供大量的臨床信息[19]?;赥CGA 并在基因表達和生存分析的交互式網(wǎng)絡(luò)應(yīng) 用(Gene Expression Profiling Interactive Analysis 2,GEPIA2)(http://gepia2.cancer-pku.cn/#index) 下, 對這些關(guān)鍵基因采用Mantel-Cox 檢驗進行生存分析[20],評價患者預(yù)后,其中總生存期是指從隨機化分組開始至因任何原因引起死亡的時間;無病生存期是指從隨機化分組開始至疾病復(fù)發(fā)或由于疾病進展導(dǎo)致患者死亡的時間。然后繪制關(guān)鍵基因的ROC 曲線,用R 軟件pROC包[21]計算ROC 曲線下面積(AUC),可以直觀地分析關(guān)鍵基因?qū)RPC 的診斷價值,一般認為AUC>0.50,越接近于1 則診斷價值越高[22]。以P<0.05 為差異有統(tǒng)計學(xué)意義。
2.1 CRPC 的DEGs 篩選 通過對微陣列數(shù)據(jù)集GSE32269 分析共篩選出279 個DEGs,其中上調(diào)基因175 個,下調(diào)基因104 個(圖1,彩圖掃描文章首頁二維碼)。
圖1 CRPC 的DEGs 篩選Figure 1 Identification of differentially expressed genes in castration-resistant prostate cancer
2.2 CRPC 的DEGs GO 富集分析和KEGG 信號通路分析 GO 富集分析結(jié)果顯示,CRPC 的DEGs 主要參與細胞黏附、細胞分裂、有絲分裂姐妹染色單體分離、有絲分裂核分裂和有絲分裂胞質(zhì)分裂等BP(圖2A、表1),主要分布在細胞外外泌體、細胞外基質(zhì)等CC(圖2B、表2),主要有細胞外基質(zhì)結(jié)構(gòu)成分、蛋白質(zhì)結(jié)合等MF(圖2C、表3)。KEGG 結(jié)果顯示,CRPC 的DEGs 主要參與黏著斑、PI3K-Akt信號通路和細胞周期等途徑(圖3)。
圖2 CRPC 的DEGs GO 富集分析結(jié)果Figure 2 GO enrichment results of differentially expressed genes in castration-resistant prostate cancer
表1 CRPC 的DEGs 主要參與的生物過程Table 1 Major biological processes in which differentially expressed genes in castration-resistant prostate cancer being involved
表2 CRPC 的DEGs 主要參與的細胞成分Table 2 Major cellular components of differentially expressed genes involved in castration-resistant prostate cancer development
表3 CRPC 的DEGs 主要參與的分子功能Table 3 Major molecular functions of differentially expressed genes involved in castration-resistant prostate cancer development
圖3 CRPC 的DEGs KEGG 富集分析結(jié)果Figure 3 KEGG enrichment results of differentially expressed genes involved in castration-resistant prostate cancer development
2.3 CRPC 的DEGs PPI 分析及關(guān)鍵基因篩選 應(yīng)用STRING 數(shù)據(jù)庫對篩選出的279 個DEGs 進行PPI 分析,通過移除分離和單獨連接的節(jié)點,應(yīng)用Cytoscape 將蛋白網(wǎng)絡(luò)可視化,得到一個由224 個節(jié)點和1 665 條邊組成的PPI 網(wǎng)絡(luò)(圖4A)。使用MCODE 識別出了最重要的模塊(分數(shù)=42.093),由43 個節(jié)點和863 條邊組成(圖4B)。根據(jù)篩選條件共鑒定出15 個關(guān)鍵基因(圖4C), 分 別 是CDC20、CCNB2、PRC1、MAD2L1、PBK、NUSAP1、RRM2、SMC2、MELK、KIF4A、DTL、ZWINT、CEP55、RACGAP1 和CDKN3(表4)。
圖4 CRPC 的DEGs PPI 網(wǎng)絡(luò)和關(guān)鍵基因Figure 4 PPI network and key genes involved in castration-resistant prostate cancer development
表4 CRPC 的DEGs 關(guān)鍵基因詳細情況Table 4 Details of key genes of differentially expressed genes involved in castration-resistant prostate cancer development
2.4 關(guān)鍵基因與CRPC 患者預(yù)后的關(guān)系 對15 個關(guān)鍵基因進行生存分析,結(jié)果顯示,CDC20(n=245)、MAD2L1(n=246)和NUSAP1(n=246)高表達組CRPC總生存期分別短于CDC20(n=245)、MAD2L1(n=246)和NUSAP1(n=246)低表達組,差異均有統(tǒng)計學(xué)意義(P=0.049,P=0.035,P=0.020), 見 圖5。CDC20、MAD2L1 和NUSAP1 高表達組CRPC 無病生存期分別短于CDC20、MAD2L1 和NUSAP1 低表達組,差異均有統(tǒng)計學(xué)意義(P=7.5E-05,P=0.043,P=0.002),見圖6。繪 制CDC20、MAD2L1 和NUSAP1 預(yù) 測CRPC 發(fā) 生 的ROC 曲線,結(jié)果顯示,AUC 分別為0.933、0.762、0.950(圖7)。
圖5 CDC20、MAD2L1 和NUSAP1 高表達組與低表達組總生存期比較的生存曲線Figure 5 Overall survival curves between castration-resistant prostate cancer patients with highly and low expressed CDC20,MAD2L1 and NUSAP1
圖6 CDC20、MAD2L1 和NUSAP1 高表達組與低表達組無病生存期比較的生存曲線Figure 6 Disease-free survival curves between castration-resistant prostate cancer patients with highly and low expressed CDC20,MAD2L1 and NUSAP1
圖7 CDC20、MAD2L1 和NUSAP1 預(yù)測CRPC 發(fā)生的ROC 曲線Figure 7 ROC curves of CDC20,MAD2L1 and NUSAP1 predicting castration-resistant prostate cancer
CRPC 發(fā)病機制復(fù)雜,AR 擴增、AR 突變及AR 變異等多種機制均參與CRPC 的發(fā)生、發(fā)展[23],但具體機制仍難以明確。本研究采用生物信息學(xué)方法分析芯片數(shù)據(jù)集共篩選出279 個DEGs,通過GO 和KEGG 富集分析發(fā)現(xiàn)DEGs 主要富集于細胞分裂、有絲分裂和細胞周期。已有研究表明,有絲分裂停滯可抑制CRPC 的進展[24]。CRPC 的發(fā)生、發(fā)展和調(diào)節(jié)細胞分裂、細胞周期的基因密切相關(guān)[25-27],提示細胞分裂、有絲分裂和細胞周期是影響CRPC 發(fā)生、發(fā)展的重要因素。
本研究在這些DEGs 中鑒定出可能參與CRPC 發(fā)生和進展的15 個關(guān)鍵基因,對其進一步驗證時發(fā)現(xiàn),CDC20、MAD2L1 和NUSAP1 的高表達均與CRPC 總生存期及無病生存期呈負相關(guān),且AUC 均>0.50,表明CDC20、MAD2L1 和NUSAP1 的表達能影響CRPC 的預(yù)后,且對CRPC 有較高的診斷價值。
CDC20 不僅是一種關(guān)鍵的E3 連接酶,還是一種細胞周期檢查點調(diào)節(jié)劑,可與腺瘤性息肉病大腸埃希菌(APC)結(jié)合,識別D-box 或KEN 盒底物以促進蛋白酶體的降解。CDC20 與APC 結(jié)合后,可通過破壞關(guān)鍵的細胞周期調(diào)節(jié)因子,在有絲分裂的中期到后期發(fā)揮致癌功能[28]。已有研究報道,上調(diào)的CDC20 在包括胰腺導(dǎo)管腺癌、乳腺癌、白血病、膀胱癌、膠質(zhì)母細胞瘤和胃癌[29-31]等多種惡性腫瘤發(fā)生和進展中起著至關(guān)重要的作用,并與這些癌癥的不良預(yù)后相關(guān)。DAI 等[32]通過遷移實驗結(jié)果表明,CDC20 可增強PCa 細胞的遷移能力。ZHANG 等[33]證明CDC20 可通過腫瘤干細胞樣細胞中的β-連環(huán)蛋白來驅(qū)動PCa 發(fā)生,其表達下降可抑制CD44+PCa 干細胞的表達,且與PCa 患者的不良預(yù)后相關(guān)。有研究證明,敲低CDC20 可抑制轉(zhuǎn)移性CRPC的發(fā)生并增強CRPC 對多西他賽的敏感性,而CDC20的過表達則可通過依賴Bim 的方式促進CRPC 細胞系對多西紫杉醇耐藥[34]。
MAD2L1 是有絲分裂紡錘體組裝檢查點的一個組成部分,阻止有絲分裂后期發(fā)生,直到所有染色體在中期排列正確。已有研究表明,MAD2L1 可促進人前列腺上皮細胞的生長[35],其過表達與小細胞肺癌侵襲性和轉(zhuǎn)移有關(guān),并可通過被MiR-200c-5p 抑制而降低人肝細胞癌的增殖和轉(zhuǎn)移[36-37]。MAD2L1 和CDC20 之間可以相互作用,在調(diào)節(jié)有絲分裂中共同發(fā)揮重要功能[35]。CHOI 等[38]發(fā)現(xiàn)CDC20 和MAD2L1 共同高表達能促進尿路上皮膀胱癌的不良預(yù)后,表明CDC20 和MAD2L1在癌癥相關(guān)疾病中可以相互影響,共同發(fā)揮作用。本研究結(jié)果顯示,CDC20 和MAD2L1 的高表達均與CRPC的不良預(yù)后相關(guān),提示CDC20 和MAD2L1 可能是影響CRPC 發(fā)生和預(yù)后的潛在基因。
NUSAP1 在紡錘體微管組織中起作用,是一種核仁-紡錘體相關(guān)蛋白。NUSAP1 在細胞增殖中特異性表達,并在細胞周期和細胞質(zhì)分裂中起至關(guān)重要的作用[39]。已有研究證實NUSAP1 是PCa 進展的生物標(biāo)志物之一,可通過調(diào)節(jié)基因表達水平來促進PCa 的侵襲、遷移和轉(zhuǎn)移,從而推動PCa 的進展[40-41]。GORDON 等[42]發(fā)現(xiàn),使用慢病毒敲低NUSAP1 減少了DU145 或PC-3-RB1 細胞的增殖和侵襲,表明NUSAP1 可影響PCa 細胞增殖和侵襲。據(jù)報道,NUSAP1 在多種癌癥中過度表達且NUSAP1 的表達升高與這些癌癥的進展密切相關(guān),包括乳腺癌、非小細胞肺癌、胃癌、卵巢癌、膀胱癌、宮頸癌、結(jié)腸癌、腎細胞癌等[43-49]。本研究結(jié)果提示,NUSAP1 的高表達與CRPC 的總生存期及無病生存期呈負相關(guān),對CRPC 有較好的診斷價值。以上研究結(jié)果表明,NUSAP1 可能是影響CRPC 早期診斷和預(yù)后的潛在因子。
綜上所述,本研究通過對CRPC 及原發(fā)性PCa 組織樣本的DEGs 分析,鑒定出3 個關(guān)鍵基因:CDC20、MAD2L1 和NUSAP1,這3 個關(guān)鍵基因與CRPC 疾病的診斷和預(yù)后密切相關(guān),為CRPC 疾病進展的分子機制研究及預(yù)后判斷提供了新靶點。但由于缺乏實驗分析,其具體機制目前尚不十分明確,需要進一步實驗驗證。
作者貢獻:董婧婷、沈宏、曹鳳宏進行文章的構(gòu)思與設(shè)計,研究的實施;董婧婷、康紹叁進行數(shù)據(jù)收集;董婧婷、劉健、田志崇進行數(shù)據(jù)整理;康紹叁、劉健、李治國進行統(tǒng)計學(xué)處理;董婧婷、衡立、張金存進行結(jié)果的分析與解釋;董婧婷撰寫論文;衡立、張立國進行論文的修訂;沈宏、曹鳳宏負責(zé)文章的質(zhì)量控制及審校,對文章整體負責(zé),監(jiān)督管理。
本文無利益沖突。