瞿根義 向茂林 徐勇 陽光 王佳威 湯乘
前列腺癌(prostate cancer,PCa)是泌尿外科常見的惡性腫瘤[1]。近年來我國PCa發(fā)病率呈逐年上升趨勢(shì),目前在泌尿系腫瘤中居第二位[2]。PCa患者易發(fā)生骨轉(zhuǎn)移,轉(zhuǎn)移后5年生存率低于29%,而且經(jīng)過內(nèi)分泌治療后,大部分患者最終會(huì)發(fā)展為去勢(shì)抵抗性PCa[3]。因此,深入研究PCa發(fā)生、發(fā)展的機(jī)制,具有重要的臨床意義。生物信息學(xué)是將計(jì)算機(jī)技術(shù)和分子生物學(xué)相結(jié)合的技術(shù),為基因的研究提供了方法。癌癥和腫瘤基因圖譜(cancer genome atlas,TCGA)和Oncomine數(shù)據(jù)庫是大型腫瘤基因芯片數(shù)據(jù)庫,具有大樣本和豐富的臨床數(shù)據(jù)。本研究利用TCGA和Oncomine數(shù)據(jù)庫深入挖掘PCa差異表達(dá)基因,然后進(jìn)行基因本體論(gene ontology,GO)和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路分析,建立蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò),并篩選Hub基因,最后通過Meta分析篩選影響PCa發(fā)生、發(fā)展的關(guān)鍵基因。
1.1 資料來源 通過TCGA數(shù)據(jù)庫(https://cancergenome.nih.gov/)下載公開的PCa RNA測序數(shù)據(jù),包括PCa組織499例,癌旁正常組織52例。
1.2 差異表達(dá)基因的獲取 采用R 3.5.3軟件的edgeR軟件包對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化及差異表達(dá)分析,篩選logFC絕對(duì)值>1.5,F(xiàn)DR<0.05的基因?yàn)椴町惐磉_(dá)基因。采用ggplot2軟件包對(duì)數(shù)據(jù)進(jìn)行圖形可視化。
1.3 差異表達(dá)基因的GO和KEGG通路分析 通過DAVID數(shù)據(jù)庫(https://david.ncifcrf.gov)對(duì)差異表達(dá)基因進(jìn)行GO和KEGG通路分析,P<0.05為差異有統(tǒng)計(jì)學(xué)意義;其中GO分析包括生物學(xué)過程(biological process,BP)、細(xì)胞組成(cell composition,CC)和分子功能(molecular function,MF)。采用R 3.5.3軟件及相應(yīng)的cluster Profiler包進(jìn)行注釋和可視化。
1.4 差異表達(dá)基因的PPI網(wǎng)絡(luò)分析 通過STRING數(shù)據(jù)庫(https://string-db.org/)對(duì)差異表達(dá)基因進(jìn)行分析并構(gòu)建PPI網(wǎng)絡(luò)[4]。采用 Cytoscape軟件中的Cytohubba篩選PPI網(wǎng)絡(luò)中連接程度前10位Hub基因。
1.5 Hub基因與PCa相關(guān)數(shù)據(jù)的獲取和Meta分析 通過Oncomine數(shù)據(jù)庫(https://www.oncomine.org)獲取Hub基因與 PCa 相關(guān)數(shù)據(jù),檢索條件:(1)基因:Hub;(2)分析類型:癌組織與正常組織的比較分析;(3)腫瘤類型:PCa;(4)閾值:P<0.0001,倍數(shù)變化>2,基因排序?yàn)榕琶?0%。采用Meta分析獲取的Hub基因與PCa相關(guān)數(shù)據(jù),得出關(guān)鍵基因。
2.1 PCa差異表達(dá)基因的篩選結(jié)果 最終篩選出PCa差異表達(dá)基因919個(gè),其中表達(dá)上調(diào)基因424個(gè),表達(dá)下調(diào)基因495個(gè),火山圖見圖1(插頁);差異最顯著的前50個(gè)基因熱圖見圖2(插頁)。
2.2 差異表達(dá)基因的GO和KEGG通路分析結(jié)果 GO分析顯示,差異表達(dá)基因BP中主要富集于突觸傳遞、細(xì)胞間信號(hào)傳導(dǎo)、跨膜轉(zhuǎn)運(yùn)和細(xì)胞分化,CC中主要富集于細(xì)胞外空間、細(xì)胞外區(qū)域、質(zhì)膜的組成部分和質(zhì)膜,MF中主要富集于序列特異性DNA結(jié)合、鈣離子結(jié)合和結(jié)構(gòu)分子活性,見表1和圖3(插頁)。KEGG通路分析顯示,差異表達(dá)基因主要富集于神經(jīng)活性配體-受體相互作用、藥物代謝-細(xì)胞色素P450和細(xì)胞色素P450代謝異種生物,見表2和圖4(插頁)。
2.3 差異表達(dá)基因的PPI網(wǎng)絡(luò)分析結(jié)果 構(gòu)建的PPI網(wǎng)絡(luò)中,差異表達(dá)基因919個(gè),其中表達(dá)上調(diào)基因424個(gè),表達(dá)下調(diào)基因495個(gè)。連接程度前10位Hub基因分別是 CDC20、CCNA2、BUB1B、HJURP、AURKB、TTK、KIF4A、MKI67、CENPA、NCAPH,見圖 5(插頁)。
2.4 Hub基因與PCa相關(guān)數(shù)據(jù)的Meta分析結(jié)果 最終獲得4個(gè)關(guān)鍵基因,分別是HJURP、KIF4A、CENPA、NCAPH,Meta分析結(jié)果見圖6(插頁)。
圖1 前列腺癌(PCa)與癌旁正常組織差異表達(dá)基因的火山圖(紅點(diǎn)所示為上調(diào)基因,綠點(diǎn)所示為下調(diào)基因,黑點(diǎn)所示為無顯著差異的基因)
圖2 前列腺癌(PCa)與癌旁正常組織差異表達(dá)最顯著的前50個(gè)基因熱圖
圖3 PCa差異表達(dá)基因GO分析的可視化圖(PCa為前列腺癌,GO為基因本體論)
圖4 PCa差異表達(dá)基因KEGG通路分析的可視化圖(PCa為前列腺癌,KEGG為京都基因與基因組百科全書)
圖5 蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)中連接程度前10位Hub基因
圖 6 關(guān)鍵基因在前列腺癌(PCa)組織中表達(dá)的 Meta分析結(jié)果(a:HJURP;b:KIF4A;c:CENPA;d:NCAPH)
隨著我國人口老年化的加劇,PCa發(fā)病率明顯升高。PCa的生物學(xué)特性是骨轉(zhuǎn)移,一旦發(fā)生轉(zhuǎn)移,PCa患者的生活質(zhì)量及生存預(yù)后均會(huì)受到較大影響[5]。因此,深入挖掘PCa發(fā)生、發(fā)展的關(guān)鍵基因具有重要的臨床意義。
TCGA是由美國癌癥研究所和美國人類基因組研究所在2006年共同發(fā)起的項(xiàng)目,主要利用高通量測序技術(shù)建成的一個(gè)綜合的、多維的癌癥地圖,以提高對(duì)癌癥的發(fā)生、診斷和治療的理解,以及對(duì)癌癥發(fā)病機(jī)制的認(rèn)識(shí)[6]。本研究從TCGA數(shù)據(jù)庫下載PCa RNA測序數(shù)據(jù),利用生物信息學(xué)技術(shù)挖掘出PCa差異表達(dá)基因919個(gè),其中表達(dá)上調(diào)基因424個(gè),表達(dá)下調(diào)基因495個(gè)。然后采用DAVID數(shù)據(jù)庫對(duì)差異表達(dá)基因進(jìn)行富集分析,GO分析顯示BP中差異表達(dá)基因主要富集于突觸傳遞、細(xì)胞間信號(hào)傳導(dǎo)、跨膜轉(zhuǎn)運(yùn)和細(xì)胞分化,CC中主要富集于細(xì)胞外空間、細(xì)胞外區(qū)域、質(zhì)膜的組成部分和質(zhì)膜,MF中主要富集于序列特異性DNA結(jié)合、鈣離子結(jié)合和結(jié)構(gòu)分子活性;而KEGG通路分析顯示,差異表達(dá)基因主要富集于神經(jīng)活性配體-受體相互作用、藥物代謝-細(xì)胞色素P450和細(xì)胞色素P450代謝異種生物。進(jìn)一步利用STRING數(shù)據(jù)庫構(gòu)建PPI網(wǎng)絡(luò),連接程度前10位Hub基因分別是CDC20、CCNA2、BUB1B、HJURP、AURKB、TTK、KIF4A、MKI67、CENPA、NCAPH。最后采用Oncomine數(shù)據(jù)庫篩選出PCa關(guān)鍵基因4個(gè),分別是HJURP、KIF4A、CENPA、NCAPH。
表1 PCa差異表達(dá)基因GO分析結(jié)果
表2 PCa差異表達(dá)基因KEGG通路分析結(jié)果
HJURP是一種蛋白質(zhì)編碼基因,作為CENPA的伴侶蛋白,在G1早期介導(dǎo)CENPA與著絲粒的組裝,從而使得細(xì)胞分裂過程中的染色體以高保真分離[7]。CENPA為著絲粒蛋白A,在細(xì)胞分裂中也起著至關(guān)重要的作用。研究表明,CENPA表達(dá)升高與多種癌癥的發(fā)展有關(guān)[8]。PCa相關(guān)研究表明,HJURP出現(xiàn)顯著高表達(dá),且與生存預(yù)后相關(guān),可作為PCa生化復(fù)發(fā)及生存預(yù)后的潛在標(biāo)志物[9]。KIF4A位于人類染色體Xq13.1,參與染色體的濃縮與分離,是有絲分裂胞質(zhì)分裂和后期紡錘體動(dòng)力學(xué)的關(guān)鍵調(diào)控因素,同時(shí)對(duì)細(xì)胞有絲分裂和DNA損傷修復(fù)發(fā)揮著關(guān)鍵的調(diào)控作用,與腫瘤的發(fā)生、發(fā)展也密切相關(guān)[10]。同樣,PCa相關(guān)研究顯示,KIF4A出現(xiàn)異常高表達(dá),且與生存預(yù)后顯著相關(guān)[11]。另有研究發(fā)現(xiàn),KIF4A表達(dá)與雄激素受體水平呈正相關(guān),在PCa患者中KIF4A與雄激素受體形成自動(dòng)調(diào)節(jié)的正反饋,并通過下調(diào)KIF4A的表達(dá)來改善恩雜魯胺的耐藥性,同時(shí)增強(qiáng)去勢(shì)抵抗性PCa細(xì)胞對(duì)內(nèi)分泌治療的敏感性[12]。NCAPH通過調(diào)節(jié)拓?fù)洚悩?gòu)酶Ⅱ的活性和染色體的分離,從而在細(xì)胞有絲分裂過程中發(fā)揮重要的調(diào)控作用。研究表明,NCAPH通過上皮間質(zhì)轉(zhuǎn)化機(jī)制來影響腫瘤細(xì)胞的遷移與侵襲[13]。PCa相關(guān)研究顯示,NCAPH同樣出現(xiàn)顯著高表達(dá),且與去勢(shì)抵抗性PCa的發(fā)生密切相關(guān),與PCa發(fā)展為去勢(shì)抵抗性PCa的時(shí)間有關(guān),可作為去勢(shì)抵抗性PCa患者生存預(yù)后的標(biāo)志物[14],但具體機(jī)制目前尚未闡明。筆者認(rèn)為對(duì)Hub基因和關(guān)鍵基因作進(jìn)一步研究,將會(huì)為PCa發(fā)生、發(fā)展的機(jī)制挖掘更多新的發(fā)現(xiàn)。
綜上所述,本研究基于TCGA和Oncomine數(shù)據(jù)庫獲取PCa關(guān)鍵基因4個(gè),包括HJURP、KIF4A、CENPA、NCAPH。但仍需要深入研究,進(jìn)一步闡明這些基因在PCa發(fā)生、發(fā)展機(jī)制中的具體生物學(xué)功能,為PCa治療提供新的線索和方向。