李康梅,陳泯锜,戴明明,陳秀榕,黎明星,何國(guó)珍#
廣西中醫(yī)藥大學(xué)1基礎(chǔ)醫(yī)學(xué)院,2賽恩斯新醫(yī)藥學(xué)院,3研究生院,南寧 530200
卵巢癌是婦女生殖系統(tǒng)致死率最高的惡性腫瘤,發(fā)病率和病死率均較高,并呈逐年上升趨勢(shì)[1-2]。數(shù)據(jù)表明,中國(guó)每年有14 080人死于卵巢癌[3]。盡管腫瘤的治療不斷發(fā)展,但仍有2/3以上的卵巢癌患者未能早期發(fā)現(xiàn)和確診,生存率仍無(wú)明顯改善,且其發(fā)病機(jī)制和起源尚未清楚[4]。因此,研究卵巢癌的發(fā)生發(fā)展機(jī)制,尋找相關(guān)的樞紐基因?qū)β殉舶┑脑缙谠\治及預(yù)后判斷具有一定意義。
加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene coexpression network analysis,WGCNA)是一種基于高通量基因表達(dá)譜的算法,廣泛應(yīng)用于各種疾病的基因共表達(dá)網(wǎng)絡(luò)識(shí)別中,以揭示基因間的相關(guān)性,尋找顯著相關(guān)的基因模塊。借助WGCNA算法構(gòu)建基因模塊,可挖掘基因模塊信息,對(duì)相關(guān)基因模塊中的樞紐基因進(jìn)行研究。本研究基于WGCNA對(duì)美國(guó)國(guó)立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)的基因表達(dá)綜合數(shù)據(jù)庫(kù)(gene expression omnibus,GEO)下載的卵巢癌基因表達(dá)譜數(shù)據(jù)集GSE18520進(jìn)行挖掘相關(guān)基因,構(gòu)建卵巢癌基因共表達(dá)網(wǎng)絡(luò),識(shí)別卵巢癌相關(guān)基因模塊及模塊內(nèi)樞紐(Hub)基因,為進(jìn)一步探索卵巢癌的發(fā)生發(fā)展機(jī)制提供一種新思路。
從GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)下載基因表達(dá)譜數(shù)據(jù)集GSE18520,共53個(gè)卵巢癌樣本和10個(gè)正常樣本,以篩選卵巢癌的差異表達(dá)基因(differentially expressed gene,DEG)。對(duì)下載的數(shù)據(jù)進(jìn)行預(yù)處理,包括提取樣本信息、構(gòu)建基因表達(dá)矩陣以及將探針名轉(zhuǎn)化為基因名等。
使用“l(fā)imma”R包篩選卵巢癌樣本和正常樣本之間的DEG。將調(diào)整后的P<0.05和|log2 fold change(FC)|>1作為篩選條件。
使用 STRING(http://www.string-db.org/)數(shù)據(jù)庫(kù)評(píng)估基因列表背后的相互關(guān)系。同時(shí),對(duì)網(wǎng)絡(luò)進(jìn)行MCODE分析,以degree cut-off=5,node score cut-off=0.2,k-core=2,maximum depth=100為參考值選擇PPI網(wǎng)絡(luò)的核心模塊。
安裝R軟件的WGCNA包,為DEG構(gòu)建一個(gè)無(wú)標(biāo)度的共表達(dá)網(wǎng)絡(luò),選取合適的加權(quán)系數(shù)β,將相關(guān)矩陣轉(zhuǎn)化為鄰接矩陣。建樹(shù)的方法采用動(dòng)態(tài)混合剪切法,將相異度作為距離測(cè)度,設(shè)定最小模塊尺寸為30,進(jìn)行模塊識(shí)別并繪制基因樹(shù)狀圖。
WGCNA中的每一個(gè)模塊都在STRING數(shù)據(jù)庫(kù)中進(jìn)行分析,通過(guò)模塊內(nèi)統(tǒng)計(jì)分析,根據(jù)每個(gè)基因與該模塊的相關(guān)系數(shù)即模塊隸屬度(module membership,MM)≥0.8且定義基因的顯著性(gene significance,GS)P<0.05篩選出核心基因。
為了研究大量基因的功能注釋?zhuān)褂谩癈lusterpro-filer”軟件包對(duì)樞紐模塊進(jìn)行了基因本體(gene ontology,GO)功能富集分析和京都基因以及基因組百科全書(shū)(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。
利用基因表達(dá)譜交互分析數(shù)據(jù)庫(kù)(gene expression profiles interactive analysis database,GEPIA,http://GEPIA.cancer-pku.cn/index.html)對(duì)核心基因進(jìn)行進(jìn)一步驗(yàn)證和生存分析。以P<0.01在GEPIA數(shù)據(jù)庫(kù)中繪制樞紐基因的生存曲線。
采用R語(yǔ)言平臺(tái)Rstuio對(duì)卵巢癌臨床特征和基因過(guò)表達(dá)模塊相關(guān)系數(shù)進(jìn)行計(jì)算。
在R軟件的“l(fā)imma”軟件包中,對(duì)53個(gè)卵巢癌樣本和10個(gè)正常樣本的GSE18520基因表達(dá)譜進(jìn)行分析。共檢測(cè)到2474個(gè)DEG(上調(diào)864個(gè),下調(diào)1610個(gè))。(圖1)
圖1 GSE18520基因表達(dá)譜中所有DEG的火山圖
根據(jù)在MCODE中評(píng)估的分?jǐn)?shù)得出的前3個(gè)簇作為核心模塊。其中MCODE 1有40個(gè)節(jié)點(diǎn)和592條邊,在這些集群中得分最高(圖2)。
共表達(dá)網(wǎng)絡(luò)符合無(wú)尺度網(wǎng)絡(luò),即出現(xiàn)連接度為k的節(jié)點(diǎn)的對(duì)數(shù)lgk與該節(jié)點(diǎn)出現(xiàn)的概率的對(duì)數(shù)lg[P(k)]呈負(fù)相關(guān),且相關(guān)系數(shù)應(yīng)>0.8。使用R軟件WGCNA包構(gòu)建權(quán)重共表達(dá)網(wǎng)絡(luò),使用分析包自動(dòng)選擇的軟閾值計(jì)算得到軟閾值β=20(scale freeR^2=0.89)。
使用WGCNA R包,可以通過(guò)平均連鎖聚類(lèi)將具有高度相關(guān)表達(dá)模式的DEG放入模塊中,并挖掘出8個(gè)模塊(圖3A)。設(shè)置閾值為0.25以合并相似模塊(圖3B),并相應(yīng)生成6個(gè)模塊。無(wú)法納入任何模塊的基因放入灰色模塊,在后續(xù)分析中剔除。其他5個(gè)模塊分別用藍(lán)色、棕色、黑色、粉色和藍(lán)綠色表示(圖3A)。GS和MM分析在藍(lán)色和藍(lán)綠色模塊中顯示出非常顯著的相關(guān)性(圖3C)。
圖2 在MOCDE中評(píng)估的PPI網(wǎng)絡(luò)中得分最高的樞紐模塊
對(duì)藍(lán)色和藍(lán)綠色樞紐模塊進(jìn)行GO功能富集分析以及KEGG通路富集分析。GO功能富集分析分別有生物過(guò)程(biological process,BP)涉及的調(diào)節(jié)神經(jīng)遞質(zhì)水平和細(xì)胞組成(cellular component,CC)涉及的細(xì)胞皮層、核外膜、細(xì)胞器外膜、有機(jī)外膜(表1)。KEGG通路富集分析主要有癌癥蛋白聚糖、視黃醇的新陳代謝、黏著斑、WNT信號(hào)通路、肌動(dòng)蛋白骨架的調(diào)節(jié)、代謝途徑(表2)。
圖3 WGCNA的構(gòu)建和關(guān)鍵模塊的識(shí)別
表1 藍(lán)色和藍(lán)綠色樞紐模塊GO功能富集分析
表2 藍(lán)色和藍(lán)綠色樞紐模塊KEGG富集通路分析
通過(guò)GEPIA數(shù)據(jù)庫(kù)對(duì)藍(lán)色模塊和藍(lán)綠色模塊的482個(gè)核心基因進(jìn)行驗(yàn)證和生存分析。根據(jù)模塊相關(guān)性大于0.9進(jìn)行篩選,得到以下8個(gè)基因:AC104667.3、BTD、DDX26B、K+通道子族B成員1(K+channel subfamily B member 1,KCNB1)、前列腺素F2α受體(prostaglandin F2 receptor,PTGFR)、腦糖原磷酸化酶(brain glycogen phosphorylase,PYGB)、runt相關(guān)轉(zhuǎn)錄因子1(runt-related transcriptionfactor1,RUNX1T1)、TMEM91。其中AC104667.3、PYGB在卵巢癌中表達(dá)上調(diào),BTD、DDX26B、KCNB1、PTGFR、RUNX1T1、TMEM91在卵巢癌中表達(dá)下調(diào)。AC104667.3、DDX26B的高表達(dá)與更好的總生存率有關(guān),BTD、KCNB1、PTGFR、PYGB、RUNX1T1、TMEM91的高表達(dá)與預(yù)后不良有關(guān)(圖4)。
本研究主要通過(guò)生物信息學(xué)分析GSE18520(53個(gè)卵巢癌樣本和10個(gè)正常樣本)的基因表達(dá)譜中卵巢癌發(fā)生及發(fā)展過(guò)程中的樞紐基因。研究結(jié)果顯示,2474個(gè)基因在腫瘤組織中有差異表達(dá)。在這2474個(gè)基因中,有864個(gè)上調(diào)基因和1610個(gè)下調(diào)基因。利用Cytoscape軟件的MCODE插件選擇PPI網(wǎng)絡(luò)中最重要的前3個(gè)模塊作為樞紐模塊,并對(duì)最重要的樞紐模塊(MCODE1)進(jìn)行GO功能富集分析以及KEGG通路富集分析的進(jìn)一步研究。
圖4 不同基因表達(dá)水平的卵巢癌患者的生存曲線
為了在卵巢癌中發(fā)現(xiàn)具有潛在價(jià)值的基因,在藍(lán)色模塊和藍(lán)綠色模塊的482個(gè)樞紐基因中根據(jù)相關(guān)系數(shù)大于0.9篩選出8個(gè)樞紐基因(AC104667.3、BTD、DDX26B、KCNB1、PTGFR、PYGB、RUNX1T1、TMEM91)。Tan 等[5]研究表明,BTD在宮頸癌中表達(dá)上調(diào),作為宮頸癌的潛在基因,其意義還需進(jìn)一步研究。DDX26B是一種RNA解旋酶,是不同的RNA進(jìn)行代謝所必需的[6]。劉志榮等[7]研究表明DDX26B基因在早期大腸癌和腺瘤中不表達(dá),而在正常大腸組織中表達(dá)。KCNB1通道的氧化是一種神經(jīng)脆弱的機(jī)制,這種機(jī)制在脊椎動(dòng)物的大腦中普遍存在[8]。如小鼠衰老過(guò)程中KCNB1通道的中度氧化可以通過(guò)影響突觸功能影響神經(jīng)元網(wǎng)絡(luò)[9]。Yu等[10]通過(guò)使用藥物直接撞擊KCNB1通道氧化激活的毒性路徑,改善小鼠顱腦損傷(traumatic brain injury,TBI)的結(jié)果,從而闡明了脊椎動(dòng)物神經(jīng)毒性的機(jī)制,為人類(lèi)創(chuàng)傷性腦損害提供一種新的治療辦法。研究認(rèn)為PTGFR和神經(jīng)生長(zhǎng)因子(nerve growth factor,NGF)蛋白在子宮腺肌病痛經(jīng)的發(fā)生和發(fā)展中起作用,血清NGF蛋白水平及血漿PTGFR蛋白水平與子宮腺肌病痛經(jīng)程度呈正相關(guān),通過(guò)抑制其表達(dá)可能為子宮腺肌病痛經(jīng)提供新的治療線索[11-12]。研究表明,PTGFR激活可能誘發(fā)子宮內(nèi)膜修復(fù)移植PTGS-2基因表達(dá)和刺激血管內(nèi)皮生長(zhǎng)因子(vascular endothelial growth factor,VEGF)、結(jié)締組織生長(zhǎng)因子(connective tissue growth factor,CTGF)、轉(zhuǎn)化生長(zhǎng)因子β1(transforming growth factor β1,TGF-β1),引發(fā)蛋白激酶C(protein kinase C,PKC)信號(hào)通路激活和基因表達(dá)[13]。PYGB目前已被報(bào)道參與多種腫瘤的發(fā)生,糖原代謝與許多其他關(guān)鍵代謝途徑交叉,在腫瘤微環(huán)境中發(fā)揮著關(guān)鍵作用,抑制糖原代謝可能是一種有前途的抗癌治療策略[14-15]。Zhou等[16]研究表明,PYGB在卵巢癌組織中表達(dá)上調(diào),高水平的PYGB表達(dá)與卵巢癌患者預(yù)后不良顯著相關(guān),這與本研究結(jié)果一致。另外敲除PYGB后可顯著抑制卵巢癌細(xì)胞的增殖、侵襲和遷移,并發(fā)現(xiàn)miRNA-133a-3p/PYGB軸在卵巢癌治療中是一個(gè)重要的診斷指標(biāo)和治療靶點(diǎn),可能成為未來(lái)治療卵巢癌的靶標(biāo)[16]。Sun等[4]研究發(fā)現(xiàn),EPB41L4A-AS2通過(guò)與miRNA-103a聯(lián)合誘導(dǎo)RUNX1T1表達(dá)可導(dǎo)致卵巢癌細(xì)胞的遷移和侵襲,證明了EPB41L4AAS2、miRNA-103a和RUNX1T1的相互作用在卵巢癌的發(fā)生和發(fā)展中起關(guān)鍵作用,但關(guān)于miRNA-103a和RUNX1T1的表達(dá)如何影響卵巢癌的發(fā)生和發(fā)展還需要進(jìn)一步的研究。Yeh等[17]研究也表明了RUNX1T1在卵巢癌細(xì)胞系中表達(dá)下調(diào),可以抑制卵巢癌細(xì)胞的生長(zhǎng),通過(guò)卵巢癌中異常的TGF-β/SMAD家族成員4(SMAD family member 4,SMAD4)信號(hào)建立表觀遺傳沉默,但RUNX1T1在卵巢癌中的作用機(jī)制尚不明確,還需進(jìn)一步研究。另外,RUNX1T1蛋白也作為診斷肝轉(zhuǎn)移的一個(gè)有前途的生物標(biāo)志物[4]。而AC104667.3、TMEM91目前尚未有相關(guān)研究。
綜上所述,本研究通過(guò)運(yùn)用一系列合理的生物信息學(xué)手段,結(jié)合文獻(xiàn)報(bào)道以及本研究結(jié)果,發(fā)現(xiàn)8個(gè)基因均與卵巢癌的發(fā)生和發(fā)展相關(guān)。而PYGB和RUNX1T1基因與卵巢癌的生存及預(yù)后密切相關(guān),可能通過(guò)細(xì)胞周期相關(guān)通路影響卵巢癌的發(fā)生、進(jìn)展及預(yù)后,為卵巢癌的進(jìn)一步研究提供依據(jù)及參考。