段紅桃 潘 勇
中南大學(xué)湘雅醫(yī)學(xué)院附屬株洲醫(yī)院超聲科,湖南株洲 412007
子宮內(nèi)膜癌是女性生殖系統(tǒng)發(fā)病率最高的惡性腫瘤之一,占女性生殖系統(tǒng)腫瘤的20%~30%,其發(fā)病率逐年升高,在我國位居女性生殖系統(tǒng)腫瘤的第二位[1-2]。目前對(duì)于子宮內(nèi)膜癌的病因尚不清楚,其主要治療手段是外科手術(shù)切除[3-4],盡管在子宮內(nèi)膜癌早期檢測方面取得進(jìn)展,但是,仍有很多子宮內(nèi)膜癌患者晚期才被確診,失去手術(shù)機(jī)會(huì),導(dǎo)致預(yù)后不良。因此對(duì)于子宮內(nèi)膜癌生物標(biāo)志物的研究一直是研究熱點(diǎn),前期也有一些學(xué)者研究發(fā)現(xiàn)一些分子和基因是子宮內(nèi)膜癌預(yù)后的影響因素,但在臨床應(yīng)用中存在特異性差,缺乏敏感性等缺點(diǎn)[5-6]。所以,尋求子宮內(nèi)膜癌診斷及預(yù)后的有效生物標(biāo)志物具有十分重要的臨床意義。
隨著計(jì)算機(jī)科學(xué)和分子生物學(xué)的飛速發(fā)展,近些年發(fā)展成了一門新的學(xué)科——生物信息學(xué),并且已廣泛應(yīng)用于腫瘤的基因?qū)W研究,揭示了大量腫瘤發(fā)生發(fā)展的生物學(xué)機(jī)制。目前全球最大的腫瘤基因芯片數(shù)據(jù)庫為TCGA 和Oncomine 數(shù)據(jù)庫,收藏了全球大量的樣本和豐富臨床數(shù)據(jù)。本研究通過下載TCGA 和Oncomine數(shù)據(jù)庫中子宮內(nèi)膜癌相關(guān)基因芯片和臨床數(shù)據(jù)進(jìn)行系統(tǒng)的生物信息學(xué)分析,獲取子宮內(nèi)膜癌差異表達(dá)基因,進(jìn)一步通過生物信息學(xué)技術(shù)獲取其關(guān)鍵基因。有望挖掘子宮內(nèi)膜癌診斷及治療的潛在生物標(biāo)志物。
子宮內(nèi)膜癌轉(zhuǎn)錄組數(shù)據(jù)從TCGA 數(shù)據(jù)庫(https://cancergenome.nih.gov/)中下載,數(shù)據(jù)檢索時(shí)間:建庫至2020 年12 月30 日,其中包括35 個(gè)癌旁正常組織樣本和552 個(gè)子宮內(nèi)膜癌組織樣本。
1.2.1 獲取差異基因 使用R 軟件中的“l(fā)imma”包識(shí)別子宮內(nèi)膜癌和正常樣本之間的差異表達(dá)基因,以|log FC|>2.0 且FDR<0.05 為條件獲取顯著差異的差異表達(dá)基因。差異表達(dá)基因的熱圖和火山圖分別由R 軟件中的“heatmap”包和“ggplot2”包生成。
1.2.2 差異表達(dá)基因的功能富集分析 使用DAVID 數(shù)據(jù)庫(http://david.ncifcrf.gov)對(duì)差異表達(dá)基因進(jìn)行功能富集分析,包括:分子功能(molecular function,MF)、細(xì)胞成分(cell composition,CC)、生物學(xué)過程(biological process,BP)和KEGG 通路,以P <0.05 進(jìn)行篩選。
1.2.3 差異表達(dá)基因的蛋白質(zhì)-蛋白質(zhì)(proteinprotein interactions,PPI)網(wǎng)絡(luò)分析 使用在線生物信息數(shù)據(jù)庫STRING 構(gòu)建差異表達(dá)基因之間PPI 的相互作用網(wǎng)絡(luò)[7]。應(yīng)用Cytoscape 軟件(version 3.6)重建PPI 網(wǎng)絡(luò)中的數(shù)據(jù),并獲取的前10 位Hub基因。
1.2.4 Oncomine 數(shù)據(jù)庫提取子宮內(nèi)膜癌中Hub 基因表達(dá)數(shù)據(jù)進(jìn)行meta 分析 使用Oncomine 數(shù)據(jù)庫對(duì)子宮內(nèi)膜癌的Hub 基因進(jìn)行meta 分析,分析條件:①基因:Hub 基因名稱;②分析類型:Cancer vs.Normal Analysis;③癌癥類型:子宮內(nèi)膜癌;④Threshold by:Fold Change>2,p-value<0.0001,GeneRank=top 10%。以P <0.05 為差異有統(tǒng)計(jì)學(xué)意義。
從TCGA 數(shù)據(jù)庫下載子宮內(nèi)膜癌轉(zhuǎn)錄組數(shù)據(jù),采用R 軟件對(duì)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行整理,最終得到587 個(gè)表達(dá)譜樣本和18 628 個(gè)基因。采用“l(fā)imma”進(jìn)行差異表達(dá)分析,以|logFC|>2.0 和FDR<0.05 共篩選出1897 個(gè)子宮內(nèi)膜癌差異表達(dá)基因,其中包括上調(diào)基因1085 個(gè),下調(diào)基因812 個(gè)。并繪制火山圖(圖1)和前50 個(gè)基因的熱圖(圖2)。
圖1 子宮內(nèi)膜癌及癌旁正常組織火山圖
圖2 子宮內(nèi)膜癌及癌旁正常組織差異表達(dá)最顯著的前50 個(gè)基因熱圖
差異表達(dá)基因功能富集分析結(jié)果顯示,其中在GO 富集分析中的BP 中富集于神經(jīng)肽信號(hào)通路和細(xì)胞間信號(hào)傳導(dǎo),在CC 中富集于細(xì)胞外間隙和細(xì)胞外基質(zhì),在MF 中富集于轉(zhuǎn)錄激活因子活性、結(jié)構(gòu)分子活性和鈣離子結(jié)合,在KEGG 通路中富集于神經(jīng)活性配體-受體相互作用和鈣信號(hào)通路。見表1~2、圖3。
圖3 CO 富集和KEGG 通路富集可視化
表1 子宮內(nèi)膜癌差異表達(dá)基因GO 富集分析結(jié)果
表2 子宮內(nèi)膜癌差異表達(dá)基因KEGG 通路富集分析結(jié)果
使用在線生物信息學(xué)庫構(gòu)建PPI 網(wǎng)絡(luò),進(jìn)一步采用Cytoscape 軟件篩選Hub 基因。其中前10 位Hub基因分別是CDC20、CCNB1、BUB1、CCNB2、DLGAP5、TPX2、NCAPG、NCAPH、CENPF 和CDCA8。見圖4。
圖4 子宮內(nèi)膜癌前10 位Hub 基因
在Oncomine 數(shù)據(jù)庫中提取子宮內(nèi)膜癌hub 基因相關(guān)數(shù)據(jù)進(jìn)行meta 分析。以P <0.05 獲得5 個(gè)關(guān)鍵基因分別為BUB1、TPX2、NCAPH、CENPF 和CDCA8。見圖5。
圖5 5 個(gè)Hub 基因在子宮內(nèi)膜癌中的表達(dá)
子宮內(nèi)膜癌是女性生殖系統(tǒng)常見的惡性腫瘤之一,占女性生殖系統(tǒng)腫瘤的20%~30%,約占女性全身惡性腫瘤的7%,并且近年來,子宮內(nèi)膜癌的發(fā)病率逐年升高[2]。目前子宮內(nèi)膜癌發(fā)生發(fā)展機(jī)制尚未十分清楚,并且其癥狀呈現(xiàn)非特異性,主要治療方式是手術(shù)切除,但術(shù)后復(fù)發(fā)率較高[8-9]。因而,尋找子宮內(nèi)膜癌早期診斷及預(yù)后的生物標(biāo)志物對(duì)于臨床治療具有重要的指導(dǎo)意義。
2006 年美國聯(lián)合發(fā)起癌癥基因組測序項(xiàng)目,通過基因測序技術(shù)構(gòu)建起多維的癌癥基因組圖譜,極大地提高了研究水平,以及對(duì)腫瘤發(fā)生、診斷和治療的認(rèn)識(shí)[10]。生物信息學(xué)作為一門新興學(xué)科,可以對(duì)大量基因同時(shí)進(jìn)行分析研究,克服了傳統(tǒng)實(shí)驗(yàn)只能同時(shí)對(duì)少數(shù)幾個(gè)基因研究的缺陷,采用生物信息學(xué)技術(shù)對(duì)TCGA 數(shù)據(jù)庫的挖掘,揭開大量生物信息所蘊(yùn)含的奧秘[9,11-12]。
本研究使用生物信息學(xué)技術(shù)對(duì)子宮內(nèi)膜癌轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,共挖掘差異表達(dá)基因1897 個(gè),包括上調(diào)基因1085 個(gè),下調(diào)基因812 個(gè)。進(jìn)一步對(duì)差異表達(dá)基因進(jìn)行功能富集分析,并通過STRING 數(shù)據(jù)庫對(duì)差異表達(dá)基因構(gòu)建PPI 網(wǎng)絡(luò),并篩選前10 位Hub基因?yàn)镃DC20、CCNB1、BUB1、CCNB2、DLGAP5、TPX2、NCAPG、NCAPH、CENPF 和CDCA8。進(jìn)一步在Oncomine 數(shù)據(jù)庫挖掘并進(jìn)行meta 分析,發(fā)現(xiàn)子宮內(nèi)膜癌發(fā)生發(fā)展的5 關(guān)鍵基因?yàn)锽UB1、TPX2、NCAPH、CENPF 和CDCA8。進(jìn)一步深入進(jìn)行文獻(xiàn)挖掘,發(fā)現(xiàn)這些基因在腫瘤中均有研究。
BUB1 是紡錘體關(guān)卡的重要組成部分,在細(xì)胞有絲分裂中發(fā)揮重要作用,調(diào)整有絲分裂的有序進(jìn)行[13]。BUB1 表達(dá)缺失或異??蓪?dǎo)致有絲分裂過程中染色體分配發(fā)生錯(cuò)誤,造成染色體不穩(wěn)定性[14]。在子宮內(nèi)膜癌中研究證實(shí)BUB1 呈現(xiàn)低表達(dá),在子宮內(nèi)膜癌的發(fā)生發(fā)展中發(fā)揮重要作用,可作為子宮內(nèi)膜癌生存預(yù)后的標(biāo)志物[15]。TPX2 蛋白為紡錘體成分的一種微管相關(guān)蛋白,同時(shí)也是一種細(xì)胞周期調(diào)控蛋白,對(duì)細(xì)胞周期中紡錘體形成起著重要的調(diào)控作用[16-17]。并且有研究結(jié)果證實(shí)在子宮內(nèi)膜癌TPX2 中出現(xiàn)異常高表達(dá),同時(shí)研究發(fā)現(xiàn)TPX2 促進(jìn)子宮內(nèi)膜癌的發(fā)生發(fā)展[18],國外文獻(xiàn)也研究證實(shí)miR-29a-5p 通過靶向TPX2 抑制子宮內(nèi)膜癌的增殖和侵襲并誘導(dǎo)其凋亡[19]。NCAPH為非染色體結(jié)構(gòu)維持蛋白凝縮蛋白復(fù)合體Ⅰ亞單位H,研究顯示NCAPH 在宮頸癌中出現(xiàn)高表達(dá),可顯著促進(jìn)宮頸癌細(xì)胞的增殖和侵襲[20-21]。CENPF 是調(diào)控著絲粒運(yùn)動(dòng)的基因,CENPF 的表達(dá)隨著細(xì)胞周期的變化而改變,在細(xì)胞有絲分裂和細(xì)胞周期的調(diào)控中發(fā)揮著作用,同時(shí)基因芯片數(shù)據(jù)的生物信息學(xué)分析也證實(shí)CENPF 與子宮內(nèi)膜癌生存預(yù)后顯著相關(guān)[22]。CDCA8在細(xì)胞周期中發(fā)揮著十分重要的調(diào)控作用。同樣研究也證實(shí)CDCA8 與子宮內(nèi)膜癌預(yù)后密切相關(guān)[23-25]。本研究也通過Oncomine 數(shù)據(jù)庫中進(jìn)行meta 分析顯示BUB1、TPX2、NCAPH、CENPF 和CDCA8 這5 個(gè)基因在子宮內(nèi)膜癌中出現(xiàn)顯著的差異表達(dá)。但目前其在子宮內(nèi)膜癌中機(jī)制尚未闡明,我們相信在子宮內(nèi)膜癌中對(duì)這5 個(gè)關(guān)鍵基因進(jìn)行進(jìn)一步研究,將會(huì)有更多發(fā)現(xiàn)。
本研究致力于發(fā)現(xiàn)影響子宮內(nèi)膜癌發(fā)生發(fā)展的關(guān)鍵基因。共挖掘子宮內(nèi)膜癌差異表達(dá)基因1897 個(gè),進(jìn)一步分析發(fā)現(xiàn)5 個(gè)關(guān)鍵基因在子宮內(nèi)膜癌出現(xiàn)差異表達(dá),可能參與調(diào)控子宮內(nèi)膜癌的發(fā)生發(fā)展。然而,其具體的生物學(xué)功能仍需要進(jìn)一步研究來闡明。